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内 E 提 要 


本 书 内 容 涵盖 了 数字 图 像 处 理 与 机 器 视觉 技术 的 基本 概念 .典型 方法 、 典 型 应 用 和 发 展 趋势 ,反映 了 这 一 
领域 的 最 新 研究 成 果 。 全 书 共 分 10 章 , 包 括 五 部 分 知识 ;第 一 部 分 是 数字 图 像 处 理 与 机 器 视觉 的 基础 理论 ， 
包括 数字 图 像 处 理 和 机 器 视觉 技术 的 基础 知识 机 器 视觉 硬件 技术 等 ;第 二 部 分 是 图 像 处 理 技术 的 基本 方法 ， 
包括 图 像 变换 ,图像 增强 .图像 分 割 .图像 复原 等 ;第 三 部 分 是 图 像 分 析 的 基本 原理 和 技术 ,包括 图 像 分 割 、 图 
像 特征 描述 和 图 像 分 析 等 ;第 四 部 分 是 图 像 编码 等 内 容 ;第 五 部 分 是 机 器 视觉 应 用 算法 实例 。 全 书 以 
TMS320DM642 DSP 图 像 处理 系 统 为 机 器 视觉 处 理 平台 ,给 出 了 大 量 的 参考 例 程 ,在 每 一 章 后 还 附 有 适量 的 习 
题 , 供 读者 学 习 和 掌握 相关 知识 。 

本 书 论述 严谨 .内容 新 颖 .图文并茂 ,注重 基本 原理 和 基本 概念 的 阐述 ,强调 理论 联系 实际 ,突出 应 用 技术 
和 实践 , 既 可 以 作为 高 等 院 校 电子 信息 与 自动 化 相关 专业 本 科 生 和 研究 生 教材 ,也 可 以 作为 从 事 信号 处 理工 
作 的 科技 人 员 及 工程 技术 人 员 的 参考 用 书 。 
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Foreword 


数字 图 像 具 有 表示 直观 、 易 于 传输 、 信 息 容量 大 等 特点 。 随 着 人 工 智 能 和 计算 机 技术 的 进 
步 与 发 展 ,数字 图 像 处 理 与 机 器 视觉 技术 的 研究 已 经 取得 了 极 大 的 进步 ,成 为 结合 计算 机 科 
学 信息 科学 统计 学 等 多 学 科 交 又, 获得 广泛 应 用 的 一 门 综合 性 学 科 。 从 日 常生 活 到 工农 业 
生产 、 国 防 建设 ,数字 图 像 处 理 与 机 器 视觉 技术 已 经 深入 各 个 领域 ,相应 的 应 用 也 越 来 越 多 。 

目前 ,图 像 处 理 与 机 器 视觉 发 展 迅速 ,新 的 理论 .新 的 技术 不 断 推 出 。 编 者 依据 多 年 从 事 
本 科 生 和 研究 生 教学 及 相关 科研 工作 的 实践 经 验 ,在 广泛 征求 了 电子 信息 与 自动 化 专业 相关 
教师 和 高 年 级 学 生 及 工程 技术 人 员 意 见 的 基础 上 , 紧 跟 最 新 图 像 处 理 与 机 器 视觉 理论 和 技术 
发 展 ,从 数字 图 像 处 理 的 基础 知识 出 发 ,由 浅 入 深 ,注重 理论 联系 实践 和 激发 学 生 兴 趣 , 给 出 大 
量 的 参考 例 程 , 意 在 全 面 提高 学 生 对 本 门 课程 的 理解 。 

本 书 在 系统 介绍 图 像 处 理 及 机 器 视觉 技术 架构 的 基础 上 ,从 工程 和 实际 应 用 角度 出 发 ,以 
TMS320DM642 DSP 图 像 处 理 系 统 为 例 ,全 面 介 绍 了 该 领域 最 新 技术 。 全 书 共 分 为 10 X. 
第 1 章 是 绪论 ,对 数字 图 像 和 机 器 视觉 技术 的 基础 知识 做 了 简要 介绍 ,着 重 介 绍 了 机 器 视觉 系 
统 的 组 成 及 方法 分 类 。 第 2 章 是 机 器 视觉 硬件 技术 ,从 光源 、 镜 头 、 图 像 采 集 ,摄像 机 及 标定 等 
对 典型 的 机 器 视觉 应 用 系统 进行 介绍 。 第 3 章 是 数字 图 像 处 理 基 础 ,着 重 介绍 了 图 像 数字 化 
过 程 、 颜 色 空 间 、 图 像 存 储 格式 及 图 像 的 评价 标准 。 第 4 章 是 图 像 变 换 , 着 重 介 绍 了 傅立叶 变 
换 、 余 弦 变 换 、 沃 尔 什 和 哈达 玛 变换 。 第 5 章 是 图 像 增强 ,从 空间 域 和 频率 域 两 大 类 入 手 ,着 重 
介绍 了 几 种 图 像 平滑 和 锐 化 算法 。 第 6 章 是 图 像 分 割 ,着 重 介 绍 了 基于 灰 度 阅 值 . 边 缘 检 测 、 
基于 区 域 分 割 三 大 类 方法 。 第 7 章 是 图 像 复原 ,着 重 介 绍 了 图 像 退 化 模型 ,分 析 了 图 像 复原 方 
法 、 运 动 模糊 复原 方法 以 及 图 像 几何 校正 方法 。 第 8 章 是 图 像 特征 描述 与 形态 分 析 , 着重 介绍 
了 灰 度 描述 、 边 界 描述 、 纹 理 描述 和 形态 分 析 的 几 种 常见 方法 。 第 9 章 是 图 像 压缩 编码 ,介绍 
了 图 像 压 缩编 码 的 必要 性 ,着 重 介 绍 了 预测 编码 .统计 编码 和 位 平面 编码 。 第 10 章 是 机 器 视 
觉 应 用 算法 实例 ,着 重 介 绍 了 图 像 去 雾 . 图 像 融合 运动 目标 检测 和 目标 跟踪 等 算法 的 设计 和 
实现 ,以 上 10 章 均 给 出 了 大 量 的 例 程 并 附 有 习题 ,便于 读者 参考 和 学 习 。 

本 书 由 黄 鹤 负责 统 稿 。 第 2、4、5、6、7 章 由 黄 稚 编写 ,第 3 章 由 杜 凯 编写 ,第 8、9 章 由 
周 熙 炜 编写 ,第 1 .10 章 由 郭 璐 编写 。 本 书 在 编写 过 程 中 得 到 了 长 安 大 学 的 支持 和 其 他 同事 的 
帮助 ,研究 生 宋 京 对 书稿 进行 了 校对 整理 并 设计 大 量程 序 , 研 究 生 孙 健 、 李 业 、 张 勇 强 、 杜 晶 晶 、 
盛 广 峰 、 徐 锦 、 李 昕 芮 参与 了 部 分 程序 的 调试 ,本 科 生 胡 凯 益 \ 刘 志 浩 、 崔 博 等 参与 了 部 分 插图 
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的 绘制 工作 ,在 此 深 表 谢 意 。 同 时 对 编写 本 书 时 所 参考 书籍 和 论文 的 作者 也 一 并 表示 诚 健 的 
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1.1 前 言 


图 像 是 一 种 常见 的 信息 表示 形式 ,是 人 们 获取 信息 的 主要 方式 。 随 着 数字 图 像 采 集 设备 
的 普及 ,数字 图 像 的 使 用 越 来 越 广泛 ,相应 的 数字 图 像 处 理 和 机 器 视觉 技术 也 应 运 而 生 。 从 一 
幅 图 像 的 采集 到 对 图 像 中 的 信息 提取 和 分 析 , 图 像 处 理 技 术 和 机 器 视 觉 技术 密 不 可 分 。 充 分 
利用 机 器 视觉 技术 能 够 提高 图 像 采 集 和 处 理 系 统 的 鲁 棒 性 ,减少 对 图 像 采 集 过 程 的 干扰 ,提高 
成 像 质 量 , 合 理 的 图 像 处 理 方法 也 能 够 弥补 成 像 过 程 中 的 不 足 , 对 于 获取 图 像 中 有 价值 的 信息 
具有 积极 影响 。 本 章 将 从 数字 图 像 的 基本 概念 出 发 ,介绍 数字 图 像 处 理 和 机 器 视觉 技术 的 相 
关 理论 及 其 发 展现 状 。 


1.2 数字 图 像 


1.2.1 数字 图 像 基 本 概念 


这 里 首先 介绍 一 下 模拟 图 像 的 概念 。 模 拟 图 像 又 称 为 连续 图 像 ,是 指 在 二 维 坐标 系 中 连 
续 变 化 的 图 像 , 即 图 像 的 像 点 是 无 限 稠密 的 ,同时 具有 灰 度 值 ( 即 图 像 从 暗 到 亮 的 变化 值 ) 。 
连续 图 像 的 典型 代表 是 由 光学 透镜 系统 获取 的 图 像 ,如 人 物 照片 和 景物 照片 等 。 

数字 图 像 ,又 称 数 码 图 像 或 数位 图 像 , 是 二 维 图 像 用 有 限 数 字数 值 像素 的 表示 。 它 由 数组 
或 矩阵 表示 ,其 光照 位 置 和 强度 都 是 离散 的 。 数 字 图 像 是 由 模拟 图 像 数 字 化 得 到 的 、 以 像素 为 
基本 元 素 的 可 以 用 数字 计算 机 或 数字 电路 存储 和 处 理 的 图 像 。 

数字 图 像 的 本 质 是 将 图 像 划 分 成 若干 均匀 的 小 栅 格 ,每 个 单元 内 的 元 素 称 为 像 元 。 这 样 
在 数学 上 ,就 可 以 用 函数 了 (x,y) 来 表示 一 幅 图 像 所 包含 的 像 元 及 其 存储 点 的 信息 。 其 中 
(x,y) 表 示 的 是 像 元 即 像素 点 的 位 置 ,函数 值 表示 点 的 信号 特征 。 


f(0,0) f(0,1) - (0, m1) 
fx.) - n es E PEE (1-1) 
ie IR fwet 5 O08 1,8 - 13 
1.2.2 ”图像 分 类 


每 个 图 像 的 像素 通常 对 应 于 二 维 空 间 中 一 个 特定 位 置 ,可 以 用 函数 f(x,y) 来 表示 。 根 据 
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这 些 采 样 数目 及 信号 特性 的 不 同 数字 图 像 可 以 划分 如 下 

(1) 灰 度 图 像 。 灰 度 图 像 是 数字 图 像 最 基本 的 形式 ,在 工业 生产 等 领域 有 着 广泛 的 使 用 。 
在 灰 度 图 像 中 ,像素 点 的 值 只 表示 该 点 的 明暗 程度 ,不 含有 该 点 的 色彩 信息 ,如 图 1-1a) 所 示 。 
灰 度 图 像 是 最 适合 处 理 的 图 像 模 式 

(2) 二 值 图 像 。 二 值 图 像 是 一 种 特殊 情况 下 的 灰 度 图 像 , 图 像 中 每 个 像 元 没有 颜色 过 渡 ， 
灰 度 等 级 只 有 0 和 1 两 种 ,因此 义 称 为 二 值 图 ,如 图 1-1b) 所 示 , 其 存储 的 方式 为 1 位 二 进 制 
数 。 二 值 图 一 般 在 目标 识别 分离 前 景 和 背景 中 使 用 较 多 ,在 工农 业 生 产 中 ,前 述 由 于 占用 资 
源 少 .易于 操作 而 被 广泛 使 用 





a) 灰 度 图 


图 1-1 多 种 模式 的 图 像 

(3) 彩 色 图 像 。 与 前 两 种 只 含有 某 点 亮度 信息 的 图 像 不 同 ,彩色 图 像 中 还 包含 了 它们 的 
色彩 信息 ,这 也 是 日 常生 活 中 使 用 最 多 的 一 类 图 像 。 对 于 彩色 图 像 ,可 以 从 三 个 角度 描述 其 内 
部 包含 的 信息 , 即 亮度 .色调 和 饱和 度 。 亮 度 与 物体 表面 对 光线 的 反射 情况 和 人 眼 成 像 的 色 党 
有 关 , 可 以 表示 某 种 色彩 的 相对 明暗 。 色 调 表示 是 否 有 其 他 色彩 挫 杂 ,以 及 某 一 色彩 单一 程 
度 。 饱 和 度 则 用 来 代表 颜色 的 鲜艳 程度 , 即 某 一 纯净 的 单 色 中 混入 白光 的 多 少 。 

(4) 立 体 图 像 。 立 体 图 像 是 一 物体 由 不 同 角度 拍摄 的 一 对 图 像 ,通常 情况 下 可 以 用 立体 
像 计 算出 图 像 的 深度 信息 

(5) 三 维 图 像 。 三 维 图 像 由 一 组 堆栈 的 二 维 图 像 组 成 。 每 一 幅 图 像 表 示 该 物体 的 一 个 横 
截面 。 数 字 图 像 也 用 于 表示 在 一 个 三 维 空间 分 布点 的 数据 ,例如 ;计算 机 断层 扫描 设备 生成 的 
图 像 ,在 这 种 情况 下 ,每 个 数据 都 称 作 一 个 体 素 

这 里 只 简单 介绍 了 数字 图 像 的 定义 及 其 分 类 ,后 续 会 给 出 详细 描述 。 男 外 ,数字 图 像 可 以 
由 许多 不 同 的 输入 设备 和 技术 生成 ,例如 数码 相机 ,扫描 仪 .坐标 测量 机 等 ,也 可 以 由 任意 的 非 
图 像 数 据 合成 得 到 ,例如 ;数学 函数 或 三 维 几 何 模 型 等 。 三 维 几 何 模 型 是 计算 机 图 形 学 的 一 个 
主要 分 支 , 数 字 图 像 处 理 领域 研究 的 是 其 变换 算法 . 


1.3 ”数字 图 像 处 理 技术 概述 


1.3.1 ”图像 数 字 化 过 程 
数字 图 像 处 理 又 称 计算 机 图 像 处 理 ,是 指 将 图 像 信 号 转换 成 数字 信号 ,进而 通过 数字 计算 
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机 及 其 他 相关 的 数字 技术 对 数字 图 像 进行 某 些 运 算 和 处 理 ,从 而 达到 某 种 预期 和 处 理 目的 。 

图 像 的 数字 化 是 数字 图 像 处 理 的 前 提 , 从 前 一 节 我 们 可 知 , 数 字 图 像 在 本 质 上 以 矩阵 形式 
存储 在 计算 机 中 ,因而 利用 计算 机 处 理 数 字 图 像 实质 上 是 对 甜 阵 进行 处 理 , 故 模拟 图 像 并 不 能 
直接 由 计算 机 处 理 , 必 须 先 将 图 像 数字 化 。 图 1-2 所 示 为 如 何 将 模拟 图 像 转 换 成 数字 图 像 的 
过 程 ,最 常见 的 划分 方案 就 是 图 中 所 示 的 方形 网 络 , 图 像 被 分 割 成 由 相 邻 像素 组 成 的 许多 水 平 
线 ,赋予 每 个 像素 位 置 的 数值 ,反映 了 模拟 图 像 上 对 应 点 的 亮度 。 


(a) 模 拟 图 像 





al 像素 灰 度 信息 数字 化 
[1 


(b) (a) 的 数字 图 像 





图 12 模拟 图 像 与 数字 图 像 的 转化 过 程 


将 图 像 从 模拟 图 像 转化 为 数字 图 像 的 过 程 称 为 数字 化 ,常见 的 形式 如 图 1-3 所 示 , 其 详细 
转化 过 程 将 在 第 3 章 介绍 。 每 个 像素 位 置 ,图 像 的 亮度 被 采样 和 量化 ,从 而 得 到 图 像 上 对 应 点 
表示 其 亮 暗 程度 的 一 个 数值 。 对 所 有 的 像素 都 完成 上 述 转化 后 ,图 像 就 被 表示 成 一 个 数字 和 拢 
阵 。 每 个 像素 具有 两 个 属性 :位置 和 灰 度 。 位 置 (或 称 地 址 ) 由 扫描 线 内 采样 点 的 坐标 确定 ， 
它们 又 称 为 行 和 列 。 灰 度 表 示 该 像素 位 置 上 的 明暗 程度 。 
像素 





采样 列 间隔 
图 1-3 图 像 数 字 化 


1.3.2 ”数字 图 像 处 理 技术 的 特点 


在 数字 处 理 技术 出 现 之 前 ,图 像 处 理 大 多 采用 图 像 的 光学 处 理 等 模拟 方法 ,例如 使 用 光学 
透镜 滤波 处 理 等 方式 。 相 对 于 模拟 方法 ,数字 图 像 处 理 具 有 以 下 优点 : 


图 像 处 理 与 机 器 视觉 


(1) 再 现 性 好 

与 模拟 图 像 不 同 ,数字 图 像 存储 在 计算 机 中 , 它 不 会 因为 图 像 的 存储 、 传 输 或 复制 等 一 系 
列 变换 操作 而 导致 图 像 质量 的 退化 ,只 要 进行 图 像 数字 化 时 能 够 遵循 采样 、 量 化、 编码 的 基本 
原则 ,使 数字 图 像 能 够 准确 地 表述 原始 场景 中 的 信息 ,数字 图 像 处 理 过 程 就 能 保持 图 像 的 真实 
再 现 。 

(2) 处 理 精度 高 

从 理论 上 讲 , 只 要 图 像 数 字 化 设备 的 精度 足够 高 .存储 设备 的 容量 足够 大 、 图 像 处 理 设备 
的 运算 速度 足够 快 ,数字 图 像 是 可 以 无 限 接近 真实 场景 的 。 现 代 扫 描 仪 可 以 把 每 个 像素 的 灰 
度 等 级 量化 为 16 位 甚至 更 高 ,这 意味 着 几乎 可 以 将 任意 一 幅 模拟 图 像 数 字 化 为 能 够 满足 大 多 
数 情况 下 需要 的 二 维 数组 。 此 外 ,模拟 处 理 技术 如 果 要 提高 一 个 数量 级 的 处 理 精 度 ,就 必须 对 
图 像 处 理 设备 进行 大 幅 改 动 , 而 在 数字 图 像 处 理 技 术 中 , 只 要 改变 程序 中 的 数组 参数 就 可 
BT. 

(3) 适 用 面 宽 

数字 图 像 处 理 技术 可 以 处 理 多 种 图 像 信息 源 。 从 图 像 反 映 的 客观 实体 尺度 看 ,可 以 小 到 
电子 显微镜 图 像 , 大 到 航空 照片 .遥感 图 像 甚至 天 文 望 远 镜 图 像 。 这 些 来 自 不 同 信息 源 的 图 像 
只 要 被 变换 为 数字 编码 形式 后 , 均 是 由 二 维 数组 表示 的 灰 度 图 像 组 合 而 成 ,因而 均 可 用 计算 机 
来 处 理 。 

(4) 灵 活性 高 

与 图 像 的 光学 处 理 相 比 , 数 字 图 像 处 理 不 仅 可 以 进行 线性 运算 ,还 可 以 进行 非 线 性 运算 ， 
凡是 可 以 用 数学 公式 和 逻辑 关系 表示 运算 , 均 可 以 通过 数字 图 像 处 理 来 实现 。 

(5) 信 息 压 缩 的 潜力 大 

图 像 信 息 内 容 丰 富 , 这 给 图 像 的 处 理 和 存储 带 来 了 困难 。 数 字 图 像 中 各 个 像素 是 不 独立 
的 ,其 相关 性 大 。 在 图 像 画 面 上 ,经 常 有 很 多 像素 有 相同 或 接近 的 灰 度 。 就 电视 画面 而 言 , 同 
一 行 中 相 邻 两 个 像素 或 相 邻 两 行 间 的 像素 ,其 相关 系数 可 达 0.9 以 上 ,而 一 般 情 况 下 相 邻 两 帧 
之 间 的 相关 性 比 帧 内 相关 性 还 要 大 些 。 因 此 ,数字 图 像 压 缩 的 潜力 很 大 ,这 对 图 像 的 传输 、 存 
储 和 处 理 有 积极 的 意义 。 


1.4 数字 图 像 处 理 的 主要 应 用 及 发 展 前 景 


1.4.1 发 展 过 程 


数字 图 像 处 理 作为 新 兴 的 研究 领域 ,最 早出 现 于 20 世纪 50 年 代 , 当时 电子 计算 机 已 经 发 
展 到 一 定 水 平 ,人 们 开始 利用 计算 机 来 处 理 图 形 和 图 像 信 息 。 它 正式 形成 一 门 学 科大 约 是 在 
20 世纪 60 年 代 初 期 ,当时 主要 的 目的 是 改善 图 像 的 视觉 质量 。 数 字 图 像 处 理 首 次 获得 实际 
成 功 应 用 是 在 美 喷气 推进 实验 室 。 他 们 对 航天 探测 器 徘徊 者 7 号 在 1964 年 发 回 的 几 千 张 月 
球 照片 ,使 用 图 像 处 理 技 术 , 如 几何 校正 、 灰 度 变换 、 去 除 噪声 等 方法 进行 处 理 ,成 功 地 绘制 出 
月 球 表面 地 图 。 它 取得 的 男 一 个 巨大 成 就 是 在 医学 上 获得 的 成 果 ;1972 年 英国 EMI 公司 工程 
Ji Housfidd 发 明了 用 于 头颅 诊断 的 X 射线 计算 机 断层 摄影 装置 , 即 根据 人 的 头 部 截面 的 投 
影 ,经 计算 机 处 理 来 重建 截面 图 像 ,简称 CT。1975 年 EMI 公司 又 成 功 研制 出 用 于 全 身 的 CT 
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装置 ,该 装置 可 获得 人 体 各 个 部 位 鲜明 清晰 的 断层 图 像 。 此 项 无 损 探 伤 诊断 技术 获得 了 1979 
年 诺 贝 尔 奖 ,这 也 证 明了 它 对 人 类 做 出 了 划时代 的 贡献 。 

随 着 计算 机 技术 和 图 像 采集 、 处 理 技术 的 发 展 ,数字 图 像 处 理 技术 在 许多 应 用 领域 受到 广 
泛 重视 并 取得 了 许多 开拓 性 成 就 ,成 为 涉及 数学 .计算 机 科学 、 模 式 识 别 、 人 工 智能 信息论 、 
生物 医学 等 多 种 学 科 交 又 的 领域 。 它 被 广泛 地 应 用 到 商业 工业、 医学 军事、 科研 等 各 
个 方面 。 

1.4.2 ”主要 应 用 及 发 展 前 景 


图 像 是 人 类 获取 和 交换 信息 的 主要 来 源 ,因此 ,图 像 处 理 的 应 用 领域 必然 涉及 人 类 生活 和 
工作 的 方方面面 。 随 着 人 类 活动 范围 的 不 断 扩大 ,图 像 处 理 的 应 用 领域 也 将 随 之 不 断 扩 大 ,其 
应 用 领域 如 表 1-1 所 示 。 
























图 像 处 理 的 应 用 领域 表 1-1 
学 科 与 行业 
航空 航天 TL JR F5 ME A 
生物 医学 工程 细胞 分 析 、 染 色 体 分 类 、X 射线 成 像 .CT 等 
通信 传真 电视 ,多 媒体 通信 等 
工业 工业 探伤 .机 器 人 产品 侦察 等 
军事 导弹 导航 ,军事 侦察 等 
文化 艺术 电影 动画 制作 等 
机 器 人 视觉 机 器 人 的 自动 视觉 导航 ,无 人 驾驶 等 
电子 商务 身份 认证 产品 防伪 等 
物理 、 化 学 结晶 分 析 \ 谱 分 析 等 
环境 保护 水 质 及 大 气 污染 调查 等 
地 质 资源 勘测 、 地 图 绘制 .GIS 等 
农业 、 林 业 农 产 物 估 产 、 植 被 分 布 调查 等 
鱼 群 分 布 调查 等 
气象 卫星 云图 分 析 等 
法 律 指纹 识别 等 





(1) 航 天 和 航空 方面 

图 像 处 理 技术 在 航天 和 航空 技术 方面 的 应 用 ,除了 JPL 对 月 球 、 火 星 照片 的 处 理 之 外 , 男 
一 方面 的 应 用 是 在 飞机 遥感 和 卫星 遥感 技术 中 。 许 多 国家 每 天 派出 很 多 侦察 飞机 对 地 球 上 其 
感 兴趣 的 地 区 进行 大 量 的 空中 摄影 。 对 这 类 图 像 进行 处 理 分 析 ,往往 需要 耗费 大 量 人 力 物 力 ， 
而 现在 改 用 配备 有 高 级 计算 机 的 图 像 处理 系 统 来 判读 分 析 , 既 节省 人 力 ,又 加 快 了 速度 ,还 可 
以 从 照片 中 提取 人 工 所 不 能 发 现 的 大 量 有 用 情报 。 从 20 世纪 60 年 代 末 以 来 ,美国 及 一 些 国 
际 组 织 发 射 了 资源 遥感 卫星 (如 LANDSAT 系列 ) 和 天 空 实验 室 (如 SKYLAB) , 受 成 像 条 件 和 
飞行 器 位 置 姿态、 环境 条 件 等 影响 ,图 像 质量 总 不 是 很 高 。 因 此 ,以 如 此 昂贵 的 代价 对 获取 的 
卫星 图 像 进 行 简 单 直观 的 判读 是 不 合算 的 ,而 必须 采用 数字 图 像 处 理 技术 。 除 此 之 外 ,在 气象 
预报 和 对 太空 其 他 星球 研究 方面 ,数字 图 像 处 理 技术 也 发 挥 了 相当 大 的 作用 。 
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(2) 生 物 医 学 工程 方面 

数字 图 像 处 理 在 生物 医学 工程 方面 的 应 用 十 分 广泛 ,并 且 取 得 了 不 错 的 成 效 。 除 CT 技 
术 之 外 ,还 有 一 类 是 对 医用 显 微 图 像 的 处 理 分 析 , 如 红细胞 、 白 细胞 分 类 ,染色 体 分 析 , 癌 细胞 
识别 等 。 此 外 ,在 X 光 肺 部 图 像 增 晰 化 、 超 声波 图 像 处 理 \ 心 电 图 分 析 、 立 体 定向 放射 治疗 等 
医学 诊断 方面 都 广泛 地 应 用 图 像 处 理 技术 ，。 

(3) 多 媒体 通信 方面 

当前 通信 的 主要 发 展 方向 是 声音 、 文 字 、 图 像 和 数据 结合 的 多 媒体 通信 。 具 体 地 讲 , 是 将 
电话 、 电 视 和 计算 机 以 三 网 合 一 的 方式 在 数字 通信 网 上 传输 ,其 中 以 图 像 通信 和 最 为 复杂 和 困 
难 。 因 图 像 的 数据 量 十 分 巨大 ,如 传送 彩色 电视 信号 的 速率 达 100Mbit/s 以 上 ,要 将 这 样 高 速 
率 的 数据 实时 传送 出 去 ,必须 采用 编码 技术 来 压缩 信息 的 比特 量 。 在 一 定 意 义 上 讲 ,编码 压缩 
是 这 些 技术 成 败 的 关键 。 除 了 已 应 用 较 广 泛 的 粹 编码 .DPCM 编码 .变换 编码 外 ,国内 外 正在 
大 力 开发 研究 新 的 编码 方法 ,如 分 行 编码 、 自 适应 网 络 编码 小波 变换 图 像 压 缩编 码 等 。 此 外 ， 
电视 制作 系统 广泛 使 用 的 图 像 处 理 、 变 换 和 合成 ,多 媒体 系统 中 静止 图 像 和 动态 图 像 的 采集 、 
压缩 处 理 、 存 储 和 传输 等 都 应 该 应 用 数字 图 像 处 理 技术 。 

(4) 工 业 和 工程 方面 

在 工业 和 工程 领域 中 ,图 像 处 理 技 术 有 着 广泛 的 应 用 。 如 自动 装配 线 中 检测 零件 的 质量 
并 对 零件 进行 分 类 ,印刷 电路 板 症 病 检查 ,弹性 力学 照片 的 应 力 分 析 , 流 体力 学 图 片 的 阻力 和 
升力 分 析 ,邮政 信件 的 自动 分 拣 ,在 一 些 有 毒 , 放 射 性 环境 内 识别 工件 及 物体 的 形状 和 排列 状 
态 ,先进 的 设计 和 制造 技术 中 采用 工业 视觉 等 。 其 中 值得 一 提 的 是 研制 具备 视觉 .听觉 和 触觉 
功能 的 智能 机 器 人 ,将 会 给 工农 业 生 产 带 来 新 的 激励 ,目前 这 样 的 机 器 人 已 在 工业 生产 中 的 喷 
漆 、 烛 接 、 装 配 中 得 到 了 有 效 的 利用 。 

(5) 军 事 公 安 方面 

在 军事 方面 ,图 像 处 理 和 识别 主要 用 于 导弹 的 精确 末 制 导 , 各 种 侦察 照片 的 判读 ,具有 图 
像 传输 存储 和 显示 的 军事 自动 化 指挥 系统 ,飞机 、 坦 克 和 军舰 模拟 训练 系统 等 ;公安 业务 图 片 
的 判读 分 析 ,指纹 识别 ,人 脸 鉴 别 , 不 完整 图 片 的 复原 ,以 及 交通 监控 .事故 分 析 等 。 目 前 已 投 
入 运行 的 高 速 公路 不 停车 自动 收费 系统 中 的 车 辆 和 和 车牌 的 自动 识别 都 是 图 像 处 理 技术 成 功 应 
用 的 例子 。 

(6) 文 化 艺术 方面 

目前 这 类 应 用 包括 有 电视 画面 的 数字 编辑 ,动画 的 制作 .电子 图 像 游 戏 、 纺 织 工艺 品 设计 、 
服装 设计 与 制作 、 发 型 设计 文物 资料 照片 的 复制 和 修复 、 运 动员 动作 分 析 和 评分 等 。 现 在 已 
逐渐 形成 一 门 新 的 艺术 一 一 计算 机 美术 。 

(7) 机 器 视觉 

机 需 视 觉 作 为 智能 机 器 人 的 重要 感觉 器 官 ,主要 进行 三 维 景物 识别 和 理解 ,是 目前 处 于 研 
究 之 中 的 开放 课题 。 机 器 视 觉 主要 用 于 军事 侦察 .危险 环境 的 自主 机 器 人 ,邮政 、 医 院 和 家 庭 
服务 的 智能 机 器 人 ,装配 线 工件 识别 ,定位 ,太空 机 器 人 的 自动 操作 等 。 

(8) 电 子 商务 

在 当前 呼声 其 高 的 电子 商务 中 ,图 像 处 理 技术 也 大 有 可 为 ,如 身份 认证 、 产 品 防伪 、 水 印 技 
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总 之 ,图 像 处 理 技术 应 用 领域 相当 广泛 ,已 在 国家 安全 经济 发 展 \ 日 常生 活 中 扮演 越 来 越 
重要 的 角色 ,对 国计民生 的 作用 不 可 低估 。 


1.5 机 器 视觉 概述 


在 工业 生产 过 程 中 ,尤其 是 现代 工业 自动 化 大 生产 中 涉及 各 种 各 样 的 基于 人 类 视觉 的 检 
dr 测量 .识别 和 控制 需求 ,例如 ,生产 流水 线 上 零 配件 的 测量 ,产品 包装 印刷 的 检测 ,半导体 芯 
片 封装 检测 ,电子 设备 生产 中 电子 元 件 定位 ,机 器 人 导航 、 网 像 监控 、 医 学 影像 处 理 等 。 这 些 应 
用 中 的 一 部 分 以 往 依 靠 大 量 工人 来 完成 ,这 不 仅 增加 了 人 工 成 本 和 管理 成 本 ,同时 由 于 人 有 眼 容 
易 疲 劳 且 具 有 不 稳定 性 ,无 法 保证 百分之百 的 检测 准确 率 。 另 外 还 有 相当 一 部 分 应 用 ,由 于 人 
眼 的 精度 .速度 上 的 限制 ,根本 无 法 由 人 工 来 完成 ,所 以 在 实际 应 用 中 迫切 需要 一 种 代替 人 类 
视觉 的 机 器 技术 出 现 。 

人 类 在 征服 自然 改造 自然 和 推动 社会 进步 的 工业 生产 过 程 中 ,面临 着 自身 能 力 、 能 量 的 
局 限 性 ,发 明和 创造 了 许多 机 器 来 辅助 或 代替 人 类 完成 任务 。 智 能 仪器 ,包括 智能 机 融 人 ,是 
这 种 机 器 最 理想 的 形式 ,也 是 人 类 科学 研究 中 所 面临 的 最 大 挑战 之 一 。 智 能 仪器 是 指 这 样 一 
种 系统 , 它 能 模拟 人 类 的 功能 ,能 感知 外 部 世界 并 有 效 地 解决 人 所 能 解决 的 问题 。 人 类 感知 外 
部 世界 主要 通过 视觉 .触觉 .听觉 和 嗅觉 等 感觉 器 官 ,其 中 8096 的 信息 是 由 视觉 获取 的 ,这 既 
说 明 视 觉 获 取信 息 量 巨大 ,也 表明 人 类 对 视觉 信息 有 较 高 的 利用 率 。 人 类 视觉 过 程 可 看 作 是 
一 个 复杂 的 从 感觉 (感受 通过 对 3-D 世界 的 2-D 投影 图 像 得 到 的 ) 到 知觉 ( 由 2-D 图 像 认 知 3-D 
世界 内 容 和 含义 ) 的 过 程 ,视觉 的 最 终 目 的 从 狭义 上 说 是 要 对 场景 做 出 对 观察 者 有 意义 的 解释 
和 描述 ;从 广义 上 讲 , 还 要 基于 这 些 解 释 和 描述 并 根据 周围 的 环境 和 观察 者 制订 出 行为 规划 。 
因此 ,对 于 智能 仪器 来 说 ,赋予 机 器 以 人 类 视觉 功能 对 发 展 智能 仪器 是 极其 重要 的 ,也 由 此 形 
成 了 一 门 新 的 学 科 一 一 机 器 视 觉 。 它 是 基于 计算 机 技术 、 机 电工 程 应 用 技术 与 数字 图 像 处 理 
技术 不 断 地 完善 和 发 展 ,将 计算 机 的 高 速度 高 精度 ,高 可 靠 性 ` 结 果 的 可 重复 性 与 人 类 视觉 的 
智能 化 抽象 能 力 相 结合 ,逐渐 形成 新 的 交叉 研究 领域 。 

机 器 视觉 的 发 展 不 仅 将 大 大 推动 智能 系统 的 发 展 ,也 将 拓宽 计算 机 与 各 种 智能 仪 咒 的 研 
究 范围 和 应 用 领域 。 


1.6 机 器 视觉 系统 的 组 成 及 特点 


机 器 视觉 技术 涉及 数字 图 像 处 理 技术 模式 识别 自动 控制 、. 光 源 和 光学 成 像 知识 模拟 与 
数字 视频 技术 .计算 机 软 硬 件 和 人 机 接口 等 多 学 科 理 论 和 技术 ,因此 很 难 给 出 一 个 十 分 精确 的 
定义 。 美 国 制造 工程 师 协会 (Society of Manufacturing Engineers, SME) 机 器 视觉 分 会 和 美国 机 
器 人 工业 协会 (Robotic Industries Association , RIA ) 的 自动 化 视 党 分 会 对 于 机 器 视觉 给 出 的 定 
义 为 :机 器 视觉 是 通过 光学 的 、 非 接触 的 传感器 自动 地 获取 和 解释 处 理 一 个 真实 物体 的 图 
像 ,以 获取 所 需 信 息 或 用 于 控制 机 器 运动 或 过 程 。 机 器 视觉 主要 研究 内 容 是 利用 计算 机 或 者 
柑 入 式 系统 来 模拟 人 的 视觉 功能 , 采用 一 个 或 多 个 摄像 机 采集 客观 事物 的 实际 图 像 , 经 过 数 
字 化 等 一 系列 处 理 提取 需要 的 特征 信息 ,然后 加 以 理解 并 通过 人 逻辑 运算 最 终 实现 工业 生产 和 
科学 研究 中 的 检测 测量 和 控制 等 功能 。 
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图 像 处 理 与 机 器 视觉 


一 个 典型 的 工业 机 融 视 觉 应 用 系统 包括 光源 .光学 系统 图 像 捕捉 系统 ,图像 数字 化 模块 、 
数字 图 像 处 理 模块 .智能 图 像 处 理 与 决策 模块 和 机 械 控制 执行 模块 。 图 1-4 为 机 器 视觉 系统 
构成 示意 图 ,机 顺 视觉 系统 的 原理 是 通过 机 需 视觉 产品 ( 即 图像 摄 取 装 置 ,分 CMOS 和 CCD 两 
种 ) 捕 获 图 像 信 号 ,然后 将 该 图 像 传送 至 处 理 单元 ,通过 数字 化 处 理 转化 成 数字 信号 ,然后 将 
其 传送 给 专用 的 图 像 处 理 系 统 ( 计 算 机 或 者 藤 入 式 系统 ) ,根据 像素 分 布 和 亮度 .颜色 等 信息 ， 
来 获取 被 测 对 象 尺 寸 . 形 状 等 信息 ,利用 各 种 运算 来 抽取 目标 的 特征 ,进而 根据 判别 的 结果 来 
控制 现场 的 机 械 设备 。 


üa Aw [Cru 机 械 执 
rd 和 控制 | | 制 HERR 
指 


/ ý 
d 光学 成 像 计算 机 或 嵌入 式 系统 


图 1-4 典型 工业 机 器 视觉 系统 的 结构 

















具体 工作 流程 如 下 : 

(1) 当 被 测 目 标 运动 到 接近 拍摄 视野 中 心 时 ,传感器 向 图 像 采 集 控制 部 分 发 送信 号 ( 触发 
脉冲 ) 。 

(2) 图 像 采 集 控制 部 分 根据 事先 编写 的 控制 程序 ,在 指定 的 时 间 分 别 向 相机 和 照明 系统 
发 出 启动 脉冲 。 

(3) 其 中 一 个 启动 脉冲 使 相机 停止 目前 的 扫描 或 结束 等 待 状态 ,打开 曝光 机 构 或 事先 在 
程序 中 设 定 曝 光 时 间 ,然后 重新 开始 新 一 轮 的 扫 找 并 输出 ; 另 一 个 启动 脉冲 根据 相机 的 曝光 时 
间 适 时 地 开启 照明 光源 。 

(4) 将 采集 到 的 图 像 存 储 到 计算 机 内 存 中 。 

(5) 计算 机 程序 及 时 地 对 图 像 进 行 处 理 、 分 析 和 识别 ,并 输出 测量 值 或 检测 结果 。 

(6) 根 据 检测 结果 控制 后 续 的 机 械 动 作 ,如 进行 筛选 .调整 姿态 等 。 

目前 ,此 类 系统 广泛 应 用 于 食品 和 饮料 .化妆品 、 建 材 和 化 工 、 金 属 加 工 、 电 子 制 造 、 包 装 、 
汽车 制造 等 行业 。 

机 器 视觉 系统 的 优点 是 提高 了 生产 的 柔性 和 自动 化 程度 ,在 一 些 不 适合 于 人 工作 业 的 危 
念 工作 环 境 或 人 工 视觉 难以 满足 要 求 的 场合 ,采用 机 器 视觉 来 蔡 代 人 工 视觉 。 同 时 ,在 大 批量 
工业 生产 过 程 中 ,用 人 工 视觉 检查 产品 质量 效率 低 且 精度 不 高 ,用 机 器 视觉 检测 可 以 大 大 提高 
生产 效率 和 生产 的 自动 化 程度 。 而 且 机 器 视觉 易于 实现 信息 集成 ,是 实现 计算 机 集成 制造 的 
基础 技术 。 

可 见 , 从 应 用 技术 划分 ,机 器 视 觉 是 一 门 综合 了 模拟 数字 电子 、 计 算 机 、 图 像 处 理 、 传 感 
器 机 械 工程 .光源 照明 光学 成 像 等 跨 学 科 的 前 沿 技 术 ; 从 应 用 学 科 划 分 ,机 器 视觉 是 一 门 涉 
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及 人 工 智 能 神经 生物 学 心理 物理 学 .计算 机 科学 .图 像 处 理 、 模 式 识别 等 多 个 领域 的 交叉 学 
科 。 机 器 视觉 是 相对 较 新 的 技术 , 它 为 制造 工业 在 提高 产品 质量 、 提 高 生产 效率 和 操作 安全 性 
上 提供 了 许多 处 理 方案 。 机 器 视觉 包括 图 像 数 字 化 .图像 操作 和 图 像 分 析 ,通常 使 用 计算 机 完 
成 ,所 以 说 它 是 一 门 涵盖 图 像 处 理 和 计算 机 视觉 的 专业 。 然 而 ,机 器 视 党 与 计算 机 视觉 和 图 像 
处 理 的 含义 并 不 相同 。 计 算 机 视觉 是 计算 机 科学 的 一 个 分 支 ,而 机 器 视觉 是 系统 工程 一 个 特 
殊 领 域 。 机 器 视觉 没有 强调 必须 在 计算 机 平台 上 实现 ,需要 获取 高 速 处 理 速度 时 经 常会 使 用 
特殊 的 专用 图 像 处理 戏 和 人 式 系统 ,与 普通 计算 机 相 比 有 一 定 的 速度 优势 。 在 工业 应 用 中 BUS 
视觉 的 特点 如 下 : 

(1) 机 器 视觉 是 一 项 综合 技术 ,其 中 包括 数字 图 像 处 理 技术 、 机 械 工程 技术 、 控 制 技术 、 电 
光源 照明 技术 .光学 成 像 技术 传感器 技术 模拟 与 数字 视频 技术 计算 机 软 硬 件 技术 和 人 机 接 
口技 术 等 。 这 些 技术 在 机 器 视觉 中 是 并 列 关 系 , 相 互 协调 应 用 才能 构成 一 个 成 功 的 工业 机 融 
视觉 应 用 系统 。 

(2) 机 器 视觉 更 强调 实用 性 ,要 求 能 够 适应 工业 生产 中 恶劣 的 环境 ,要 有 合理 的 性 价 比 ， 
具有 通用 的 工业 接口 ,能 够 由 普通 工作 者 来 操作 ,有 较 高 的 容错 能 力 和 安全 性 ,不 会 破坏 工业 
产品 ,必须 有 较 强 的 通用 性 和 可 移植 性 。 

(3) 机 器 视觉 更 强调 实时 性 ,要 求 高 速度 和 高 精度 ,因而 计算 机 视觉 和 数字 图 像 处 理 中 的 
许多 技术 目前 还 难以 应 用 于 机 器 视觉 ,它们 的 发 展 速度 远 远 超 过 其 在 工业 生产 中 的 实际 应 用 
速度 。 

(4) 对 机 器 视觉 工程 师 来 说 ,除了 要 具有 研究 数学 理论 和 编制 计算 机 软件 的 能 力 外 ,还 需 
要 掌握 光 、 机 、 电 一 体 化 的 综合 能 力 。 


1.7 机 器 视觉 技术 的 主要 应 用 与 发 展 


1.7.1 机 器 视觉 的 应 用 领域 


机 器 视觉 不 会 有 人 眼 的 疲劳 ,有 着 比 人 眼 更 高 的 精度 和 速度 ,借助 红外 线 、 紫 外 线 、X 射 
线 、 超 声波 等 高 新 探测 技术 ,机 器 视觉 在 探测 不 可 视 物 体 和 高 危险 场景 时 ,更 具有 其 突出 的 优 
点 。 机 器 视觉 技术 现 已 在 如 下 方面 得 到 广泛 的 应 用 (其实 包含 了 很 多 数字 图 像 处 理 的 应 用 ) 。 
(1) 机 器 视觉 在 工业 中 的 应 用 
机 器 视觉 系统 可 用 于 工业 领域 的 很 多 方面 ,应 用 机 器 视觉 技术 最 多 的 部 门 是 电子 工业 部 
门 ,其 次 是 汽车 工业 \ 木材 工业 纺织 工业 食品 加 工 工业 包装 工业 及 航空 工业 等 部 门 。 在 工 
业 检 测 领域 ,机 器 视觉 技术 的 应 用 大 大 提高 了 产品 质量 和 生产 速度 。 例 如 饮料 行业 的 饮料 填 
充 检 测 容器 质量 检测 .饮料 瓶 封 口 检测 ,产品 包装 检测 ,印刷 质量 检测 ,半导体 集成 块 封 装 质 
量 检测 ,木材 厂 的 木料 检测 , 卷 钢 质量 检测 和 关键 机 械 零 件 的 工业 CT( 工业 用 计算 机 断层 成 像 
BUR) ;在 海关 ,还 可 利用 X 射线 和 机 器 视觉 技术 进行 货物 不 开 箱 通关 检测 ,大 大 提高 了 货物 
的 通过 速度 ;在 制药 领域 ,机 器 视觉 技术 可 对 药品 的 包装 进行 检测 ,以 确定 装 人 正确 数量 的 
药品 。 
在 冶金 .化 工 、 建 材 , 安 全 保卫 、 工 件 检 测 等 工业 生产 过 程 中 ,对 象 复杂 ,过 程 涉及 参数 众 
多 ,并 有 显著 的 非 线性 、 骤 变性 、 离 散 性 、 分 布 性 和 不 确定 性 。 尤 其 是 在 周围 环境 极其 恶劣 ( 例 
-es 9 
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如 高 温 环境 和 不 确定 对 象 , 其 形状 参数 难以 用 普通 的 测量 手段 进行 测量 ) 的 情况 下 ,用 常规 控 
制 技术 难以 实现 实时 控制 。 对 于 这 类 复杂 对 象 的 自动 控制 ,所 遇 到 的 最 大 困难 是 检测 问题 ,而 
大 多 数 场合 ,可 通过 机 器 视觉 来 实现 。 

(2) 机 器 视觉 在 农业 中 的 应 用 

随 着 图 像 处 理 技术 的 专业 化 ,计算 机 硬件 成 本 的 下 降 以 及 运行 速度 的 提高 ,在 农产品 品质 
自动 检测 和 分 级 领域 应 用 机 器 视觉 系统 已 变 得 越 来 越 具有 吸引 力 。 农 产品 在 其 生产 过 程 中 由 
于 受到 人 为 和 自然 等 复杂 因素 的 影响 ,产品 品质 差异 很 大 ,如 形状 、 大 小 、 色 泽 等 都 是 变化 的 ， 
很 难 做 到 整齐 划一 , 故 在 农产品 品质 检测 与 分 析 时 ,要 有 足够 的 应 变 能 力 来 适应 情况 的 变化 。 
机 器 视觉 技术 在 农产品 品质 检测 上 的 应 用 正 是 满足 了 这 些 应 变 的 要 求 ,根据 产品 质量 好 坏 确 
定价 格 。 农 产品 的 尺寸 .形状 和 颜色 是 农产品 品质 的 重要 特征 ,比如 对 水 果 可 根据 大 小 .颜色 、 
形状 等 特征 进行 分 类 ,对 禽 蛋 可 根据 形状 大 小 ,色泽 和 重量 等 特征 进行 分 类 ,而 对 烟叶 则 可 根 
据 形状 纹理 .颜色 和 面积 等 进行 分 类 。 利 用 机 器 视觉 进行 检测 不 仅 可 以 排除 主观 因素 干扰 ， 
而 且 还 能 对 这 些 指标 进行 定量 描述 ,具有 人 工 检测 所 无 法 比拟 的 优越 性 。 利 用 机 器 视觉 还 可 
监测 作物 的 生长 状况 ,做 出 是 否 浇灌 和 施肥 的 决定 ,以 保证 作物 的 健康 成 长 。 

(3) 机 器 视觉 在 医学 中 应 用 

在 医学 领域 ,机 器 视觉 可 用 于 辅助 医生 进行 医学 影像 的 分 析 , 主要 利用 数字 图 像 处 理 技 
术 , 信 息 融 合 技术 对 X 射线 透视 图 ,核磁 共振 图 像 .CT 图 像 或 其 他 医学 影像 数据 进行 统计 和 
分 析 , 不 同 医学 影像 设备 得 到 的 是 不 同 特性 的 生物 组 织 的 图 像 。 例 如 ,X 射线 反映 的 是 骨骼 组 
织 ,核磁 共振 影像 反映 的 是 有 机 组 织 ,而 医生 往往 需要 考虑 骨骼 与 有 机 组 织 的 关系 ,因而 需要 
利用 数字 图 像 处 理 技术 将 两 种 图 像 适当 地 春 加 起 来 ,以 便于 医学 分 析 。 机 器 视觉 技术 还 可 畏 
助 医生 进行 医学 影像 分 析 或 影像 数据 的 统计 ,如 利用 边缘 提取 和 图 像 分 割 技术 ,自动 完成 细胞 
个 数 统计 ,大 大 提高 了 统计 效率 和 诊断 准确 率 。 

(4) 机 器 视觉 在 机 器 人 导航 及 视觉 伺服 系统 的 应 用 

赋予 机 器 人 视觉 是 机 器 人 研究 的 重点 之 一 ,其 目的 是 要 通过 图 像 定 位 和 图 像 理 解 向 机 器 
人 运动 控制 系统 反馈 目标 或 自身 的 状态 与 位 置信 息 。 在 机 器 人 导航 和 视觉 伺服 系统 中 ,通过 
获取 图 像 并 分 析 信 息 ,向 运动 控制 系统 反馈 目标 信息 ,提高 其 在 复杂 环境 下 的 自 适应 能 力 。 机 
器 人 可 以 利用 动态 图 像 识 别 和 跟踪 算法 , 眼 踪 目 标 位 置 并 反馈 至 控制 系统 ,使 目标 始终 保持 在 
视野 的 正中 位 置 等 。 

(5) 机 器 视觉 在 图 像 监 控 \ 安 防 ,交通 管理 中 的 应 用 

传统 的 交通 监控 方法 ,如 电磁 感应 环线 圈 式 车 辆 检测 器 , 由 于 它 埋 在 路 基 下 ,车辆 通过 时 
对 线圈 的 压力 以 及 路 面 维修 均 会 破坏 线圈 ,而 且 存 在 不 能 识别 车 辆 行驶 方向 .不 能 进行 车 辆 分 
类 等 缺点 。 而 雷达 波 检测 器 只 能 检测 运动 车 辆 ,对 车 辆 缓行 和 静止 的 情况 则 无 法 检测 。 基 于 
机 器 视觉 技术 开发 的 交通 监控 系统 ,实时 工作 性 强 ,被 广泛 应 用 于 车 辆 识别 和 调度 ,向 交通 指 
挥 和 管理 系统 提供 相关 信息 等 ,适应 譬如 高 速 公路 城市 道路 等 各 种 交通 环境 的 能 力 强 ,使 交 
通 监控 系统 更 加 智能 化 ,能 提供 更 多 的 功能 。 同 时 ,在 闭路 电视 监控 系统 中 ,机 器 视觉 技术 党 
被 用 于 提高 图 像 质量 ,监控 复杂 场景 捕捉 突 发 事件 ,鉴别 身份 和 跟踪 可 疑 目标 等 。 在 卫星 明 
感 系统 中 ,机 器 视觉 系统 可 以 通过 分 析 遥 感 图 像 ,进行 环境 监测 和 地 理 测量 等 作业 。 
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1.7.2 ”机 器 视觉 的 发 展 过 程 及 趋势 

1) 国外 的 发 展 历程 

从 全 球 范围 来 看 ,到 目前 为 止 ,机 器 视觉 的 发 展 主要 经 历 了 萌芽 PER EDRR IR 
入 发 展 和 广泛 应 用 四 个 阶段 。 机 器 视觉 研究 出 现 于 20 世纪 60 年 代 初 期 ,电视 摄像 技术 的 成 
熟 与 计算 机 技术 的 发 展 使 得 机 器 视觉 研究 成 为 可 能 ,作为 早期 人 工 智 能 研究 的 一 部 分 ,由 于 技 
术 条 件 的 限制 ,进展 缓慢 。80 年 代 初 ,在 D. Marr 提出 的 计算 机 视觉 理论 的 指导 下 ,机 器 视觉 
研究 得 到 了 迅速 发 展 , 成 为 现代 科技 研究 的 一 个 热点 。 在 机 器 视 党 发 展 的 历程 中 ,经 历 了 三 个 
明显 的 加 速 点 ,一 是 首先 在 机 器 人 的 研究 中 发 展 起 来 的 机 髓 视觉 最 先 的 应 用 来 自 “ 机 器 人 "的 
研制 ;二 是 CCD 图 像 传感器 的 出 现 ,CCD 摄像 机 替代 硅 靶 摄像 是 机 器 视觉 发 展 历程 中 的 一 个 
重要 转折 点 ;三 是 CPU DSP 等 图 像 处 理 硬 件 技术 的 进步 ,为 机 器 视觉 飞速 发 展 提 供 了 基础 条 
件 。 而 计算 机 软件 技术 使 现 有 大 规模 集成 电子 电路 技术 发 展 的 成 果 达 到 了 极 大 化 的 利用 ,万 
其 是 多 媒体 和 数字 图 像 处 理 及 分 析 理 论 方面 的 技术 成 熟 ,使 得 机 器 视觉 技术 不 仅 在 理论 ,而 且 
在 应 用 上 都 得 到 了 高 速 发 展 。 随 着 计算 机 技术 的 快速 发 展 , 机 器 视觉 在 工业 中 得 以 应 用 ,如 印 
刷 电 路 板 的 检验 ,高 精度 导弹 的 末 制 导 、 机 器 人 装配 线 汽车 流量 检测 等 方面 都 有 机 央视 觉 系 
统 的 应 用 。 目 前 ,在 国外 ,机 器 视觉 在 50% 以 上 的 半导体 及 电子 行业 的 生产 监控 中 得 到 普及 
应 用 。 如 今 , 机 器 视觉 行业 已 经 进入 高 速 发 展 时 期 ,机 器 视觉 产品 在 下 游行 业 , 尤 其 是 工业 控 
制 领 域 实现 了 广泛 的 应 用 ,机 器 视觉 技术 已 逐步 走向 成 熟 。 全 球 机 髓 视觉 产业 主要 分 布 于 北 
美 .欧洲 以 及 日 本 地 区 。 其 中 北美 占 比 达到 了 61% ,欧洲 占 比 为 14% ,日 本 为 9% 。 

2) 国 内 的 发 展 历程 

据 中 国产 业 调研 网 发 布 的 (中国 机 器 视觉 行业 现状 分 析 与 发 展 趋势 研究 报告 (2015 年 
版 )》 显 示 ,国内 机 器 视觉 起 步 于 20 世纪 80 年 代 的 技术 引进 ,不 同 于 国外 ,这 一 时 期 电子 和 半 
导体 行业 在 国内 尚未 完全 成 熟 , 因 此 在 这 些 领域 的 应 用 几乎 为 空白 。 而 随 着 各 行 各 业 对 采用 
图 像 和 机 器 视觉 技术 的 工业 自动 化 .智能 化 需求 的 广泛 出 现 , 我 国 各 大 高 校 、 研 究 所 和 一 些 企 
业 近 些 年 在 图 像 和 机 器 视觉 技术 领域 进行 了 积极 的 探索 ,取得 了 一 定 的 成 绩 ,并 逐步 应 用 在 工 
业 现 场 。 机 器 视觉 技术 在 国内 的 应 用 于 20 世纪 90 年 代 正 式 进 入 发 展期 。 但 直到 2006 年 以 
前 ,中 国 机 器 视觉 产品 应 用 主要 集中 在 外 资 制造 企业 、 出 口 加 工 企业 及 烟草 企业 ,整体 规模 并 
不 大 。 加 速 发 展 则 出 现在 近 几 年 ,虽然 起 步 较 晚 ,但 受 机 器 视觉 产品 成 本 下 降 和 技术 的 进步 以 
及 新 兴 行 业 兴 起 的 良性 影响 ,中 国正 在 成 为 世界 机 器 视觉 发 展 最 活路 的 地 区 之 一 ,其 中 最 主要 
的 原因 是 中 国 已 经 成 为 全 球 的 加 工 中 心 , 许 许 多 多 先进 生产 线 已 经 或 正在 迁移 至 中 国 ,伴随 这 
些 先进 生产 线 的 迁移 ,许多 具有 国际 先进 水 平 的 机 器 视觉 系统 也 进入 中 国 。 对 这 些 机 退 视 觉 
系统 的 维护 和 提升 而 产生 的 市 场 需求 也 将 国际 机 器 视觉 企业 吸引 而 至 ,国内 的 机 器 视觉 企业 
在 与 国际 机 髓 视觉 企业 的 学 习 与 竞争 中 不 断 成 长 。 经 历 了 长 期 的 扑 伏 ,2010 年 我 国 机 器 视觉 
市 场 迎 来 了 爆发 式 增长 。 数 据 显示 ,2010 年 我 国 机 器 视觉 市 场 规模 达到 8.3 亿 元 ,同比 增长 
48.2% ,其 中 智能 相机 、 软 件 、 光 源 和 板 卡 的 增长 幅度 都 达到 了 50% ,工业 相机 和 镜头 也 保持 
了 40% 以 上 的 增幅 , 皆 为 2007 年 以 来 的 最 高 水 平 。2011 年 ,我 国 机 需 视 党 市 场 步 人 后 增长 调 
整 期 。 相 较 2010 年 的 高 速 增长 ,虽然 增长 率 有 所 下 隆 , 但 仍 保持 很 高 的 水 平 。2011 年 中 国 机 
器 视觉 市 场 规模 为 10.8 亿 元 ,同比 增长 30. 196 , 增 速 同比 2010 年 下 降 18. 1 个 百分点 ,其 中 智 
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能 相机 工业 相机 软件 和 板 卡 都 保持 了 不 低 于 30% 的 增 速 ,光源 也 达到 了 28. 6% 的 增长 幅 
度 , 增 幅 远 高 于 中 国 整 体 自动 化 市 场 的 增长 速度 。2011 年 机 器 视觉 产品 电子 制造 行业 的 市 场 
规模 为 5 亿 元 人 民 币 ,增长 35.1% ,市 场 份额 达到 了 46.396 。 电 子 制 造 , 汽 车 制药 和 包装 机 
械 占据 了 近 70% 的 机 器 视觉 市 场 份额 。 

在 我 国 , 短 短 的 几 年间 , 机 器 视觉 技 术 的 应 用 就 从 电子 半导体 领域 覆盖 到 了 大 量 工业 应 用 
领域 ,如 包装 、 电 子 汽车 制造 半导体、 纺织, 烟草 交通、 物流 等 行业 。 工 业 领 域 是 我 国 机 器 视 
觉 应 用 比重 最 大 的 领域 ,主要 用 于 产品 质量 检测 分类、 机 器 人 定位 ` 包 装 等 ,一 方面 它 替 代 人 
工 视觉 , 男 一 方面 用 于 提高 生产 的 柔性 和 自动 化 程度 。 男 外 ,将 机 器 视觉 应 用 于 机 器 人 的 引导 
中 ,可 以 实现 生产 的 柔性 化 ,使 生产 线 很 容易 适应 产品 的 变化 ,成 为 近年 的 发 展 热点 。 

总 之 ,机 器 视觉 技术 的 优越 性 已 在 医疗 诊断 自动 检测 与 控制 .智能 机 器 人 、 军 事 . 工 业 农 
业 等 方面 得 到 了 充分 体现 ,给 人 类 带 来 了 巨大 的 经 济 效益 和 社会 效益 。 经 过 多 年 来 的 研究 ,机 
器 视觉 在 深度 和 广度 方面 都 取得 了 很 大 的 进展 ,积累 了 丰富 的 学 术 研 究 成 果 , 已 经 成 长 为 一 门 
内 容 十 分 丰富 的 独立 学 科 。 在 应 用 研究 方面 也 取得 了 不 小 的 进展 ,如 图 纸 的 自动 录入 .光学 字 
符 阅 读 器 、 机 器 人 视觉 系统 在 工业 生产 装配 线 上 的 应 用 等 都 十 分 引 人 注 目 。 近 年 来 , 随 着 计算 
机 技术 的 高 速 发 展 ,机 器 视觉 系统 的 成 本 大 幅度 下 降 ,为 应 用 研究 奠定 了 坚实 的 基础 。 应 用 视 
觉 研 究 鞍 勃兴 起 ,前景 十 分 光明 。 

1.7.3 ”机 器 视觉 技术 的 发 展 趋势 

回顾 机 器 视觉 的 发 展 历程 ,可 以 看 到 两 条 清晰 的 道路 :理论 方法 研究 和 应 用 研究 。 前 者 从 
纯 学 术 的 角度 出 发 ,研究 模拟 人 类 视觉 的 各 种 理论 与 算法 (如 特征 提取 、 双 目 立 体 视觉 .运动 
与 光 流 、 由 线条 图 到 实体 、 由 阴影 到 形体 、 由 纹理 到 形体 等 ) ;后 者 从 实际 问题 出 发 ,研究 识别 、 
检测 等 问题 (如 工件 的 识别 、 印 刷 用 电路 板 的 检验 .字符 识别 等 ) 。 总 体 来 讲 , 学 术 研 究 与 应 用 
研究 相差 很 远 ,原因 可 能 是 纯 学 术 研究 做 了 过 多 偏离 实际 情况 的 假设 ,低估 了 实际 问题 的 复杂 
性 ,造成 其 成 果 难 以 实用 化 。 当 然 ,机 器 视觉 本 身 是 十 分 复杂 的 ,研究 只 能 逐步 深入 。 可 以 预 
计 的 是 , 随 着 机 器 视觉 技术 自身 的 成 熟 和 发 展 , 它 将 在 现代 和 未 来 制造 企业 中 得 到 越 来 越 广泛 
的 应 用 。 

未 来 机 器 视觉 的 发 展 将 呈现 下 列 趋势 ; 

(1) 随 着 产业 化 脚步 的 加 快 ,对 机 器 视觉 技术 的 需求 将 不 断 增加 

就 全 球 而 言 , 机 器 视觉 虽 不 是 一 项 新 技术 ,但 正 处 在 蓬勃 发 展 的 时 期 。 正 如 机 器 视觉 在 国 
外 的 发 展 一样 ,其 发 展 空间 较 大 的 部 分 是 半导体 和 电子 行业 。 近 年 来 ,我 国 加 大 了 对 集成 电路 
产业 的 规划 和 投入 力度 ,信息 化 带动 产业 化 天 走 新 型 工业 化 道路 "的 发 展 战略 为 机 器 视觉 技 
术 的 发 展 提供 了 广阔 的 空间 。 机 器 视觉 行业 专业 性 公司 增多 ,投资 和 从 业 人 员 增 加 ,竞争 加 剧 
是 机 需 视 觉 行业 未 来 几 年 的 发 展 趋势 ,机 器 视觉 行业 作为 一 个 新 兴 的 行业 将 逐步 发 展 成 熟 ,将 
越 来 越 受 到 人 们 的 重视 。 

(2) 制 定 统一 开放 的 标准 是 机 器 视觉 发 展 的 动力 ,标准 化 、 一 体 化 的 解决 方案 是 机 器 视觉 
技术 的 发 展 趋势 

目前 ,国内 的 机 器 视觉 产品 厂商 不 仅 在 技术 上 与 国外 有 较 大 差距 ,在 品牌 和 知识 产权 上 的 
差距 则 更 大 。 国 内 的 机 器 视觉 厂商 主要 以 代理 国外 品牌 为 主 ,自主 研发 起 步 较 晚 ,但 正在 朝 着 





这 个 方向 努力 。 因 此 ,未 来 的 机 器 视觉 产品 的 好 坏 只 有 通过 制定 统一 开放 的 国际 化 标准 ,而 不 
是 通过 单一 的 因素 来 衡量 和 判定 ,只 有 这 样 ,才能 让 更 多 的 厂商 在 同一 平台 上 开发 出 更 多 更 有 
价值 的 产品 。 

随 着 自动 化 开放 程度 的 不 断 提高 ,机 器 视觉 技术 也 应 随 之 进行 二 次 开发 ,以 满足 不 同 客户 
的 需求 ,这 就 要 求 对 机 器 视觉 进行 标准 化 ,并 在 未 来 的 3 ~4 年 内 逐渐 向 一 体 化 迈进 。 随 着 机 
央视 觉 技 术 的 提高 和 产品 的 增多 ,其 应 用 状况 也 将 由 低 端 转向 高 端 ,由 自动 化 向 智能 化 转变 。 

(3 ) 技 术 方 面 的 趋势 是 数字 化 、 实 时 化 .智能 化 

图 像 采 集 与 传输 的 数字 化 是 机 央视 觉 在 技术 方面 发 展 的 必然 趋势 。 更 多 的 数字 摄像 机 、 
更 宽 的 图 像 数据 传输 带宽 .更 高 的 图 像 处 理 速度 ,以 及 更 先进 的 图 像 处理 算 法 将 会 推出 ,将 会 
得 到 更 广泛 的 应 用 。 这 样 的 技术 发 展 趋势 将 使 机 器 视觉 系统 向 着 实时 性 更 好 和 智能 程度 更 高 
的 方向 不 断 发 展 。 

(4) 产 品 方面 

QO 智能 摄像 机 将 会 占据 市 场 主要 地 位 

智能 摄像 机 具有 体积 小 、 价 格 低 、 使 用 安装 方便 .用户 二 次 开发 周期 短 等 优点 ,非常 适合 在 
生产 线 上 安装 使 用 , 越 来 越 受 到 用 户 的 青睐 。 智 能 摄像 机 所 采用 的 许多 部 件 与 技术 都 来 自 IT 
行业 ,其 价格 会 不 断 降 低 ,逐渐 被 最 终 用户 所 接受 。 因 此 ,在 众多 的 机 器 视觉 产品 中 ,预计 智能 
摄像 机 在 未 来 会 占据 主要 地 位 。 此 外 ,机 器 视觉 传感器 会 逐渐 发 展 成 为 光电 传感器 中 的 重要 
产品 。 目 前 许多 国际 著名 的 光电 传感器 生产 企业 ,如 KEYENCE, OMRON, BANNER 等 都 将 机 
髓 视觉 传感器 作为 光电 传感器 中 新 型 的 传感器 来 发 展 与 推广 。 

@) 功 能 逐渐 增多 

更 多 功能 的 实现 主要 是 来 自 于 计算 能 力 的 增强 .更 高 分 辩 率 的 传感器 (10Mpixels 以 上 ) 、 
更 快 的 扫描 率 (500 次 /s 以 上 ) 和 软件 功能 的 提高 。PC 机 处 理 器 的 速度 在 得 到 稳步 提升 的 同 
时 ,其 价格 也 在 下 降 , 这 推动 了 更 快 的 总 线 的 出 现 , 而 总 线 又 反 过 来 允许 具有 更 多 数据 的 更 大 
图 像 以 更 快 的 速度 进行 传输 和 处 理 。 

@) 产 品 小 型 化 和 集成 化 

产品 的 小 型 化 趋势 让 这 个 行业 能 够 在 更 小 的 空间 内 安装 更 多 的 器 件 , 这 意味 着 机 器 视 党 
产品 变 得 更 小 ,这 样 它们 就 能 够 在 厂区 所 提供 的 有 限 空 间 内 应 用 。 例 如 在 工业 配件 上 ,LED 
已 经 成 为 主导 光源 , 它 的 小 尺寸 使 成 像 参 数 的 测定 变 得 容易 ,其 耐用 性 和 稳定 性 非常 适用 于 工 
三 设 备 。 机 器 视觉 技术 离 不 开 处 理 器 的 发 展 ,对 处 理 器 技术 的 依赖 将 越 来 越 深 ,与 数据 采集 等 
其 他 控制 和 测量 的 集成 也 将 更 为 紧密 。 基 于 租 入 式 的 产品 逐渐 取代 板 卡 式 产 品 是 一 种 必然 的 
趋势 。 

@ 智 能 相机 的 发 展 预 示 了 集成 产品 增多 的 趋势 

智能 相机 是 在 一 个 单独 的 盒 内 集成 了 处 理 器 镜头 光源、 输入 /输出 装置 及 以 太 网 的 综合 
系统 。 电 话 和 PDA 推动 了 更 快 更 便宜 的 精简 指令 集 计算 机 ( RISC) 的 发 展 ,这 使 智能 相机 和 
先入 式 处 理 器 的 出 现成 为 可 能 。 同 样 ,现场 可 编程 门 列 阵 (FPCA ) 技 术 的 进步 为 智能 相机 增 
添 了 计算 功能 ,并 为 PC 机 艇 人 了 处 理 器 和 高 性 能 帧 采集 器 智能 相机 结合 处 理 大 多 数 计算 任 
务 的 FPGA。DSP 和 微 处 理 器 的 小 型 化 ,以 及 尺寸 更 小 ,更 密集 的 存储 卡 及 成 像 器 分 辨 率 , 正 
在 一 起 为 实现 “芯片 上 的 视觉 系统 ”的 最 终 目 标 而 努力 。 
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(5) 价 格 持 续 下 降 , 市 场 份额 迅速 扩大 

目前 ,在 我 国 , 机 器 视觉 技术 还 不 太 成 熟 ,主要 靠 进口 国外 整套 系统 ,系统 价格 比较 昂贵 。 
随 着 技术 的 进步 ,以 及 市 场 竞争 的 激烈 ,价格 下 降 已 成 必然 趋势 ,这 意味 着 机 器 视觉 技术 将 逐 
渐 被 接受 。 市 场 份额 :一 方面 已 经 采用 机 器 视觉 产品 的 应 用 领域 ,对 机 器 视觉 产品 的 的 依赖 性 
将 更 强 ; 另 一 方面 机 器 视觉 产品 将 应 用 到 其 他 更 广 的 领域 。 因 此 ,机 器 视觉 市 场 将 不 断 增 大 。 


1.8 ”本章 小 结 


图 像 作为 重要 的 信息 表示 形式 ,在 各 个 领域 有 着 广泛 的 使 用 。 本 章 从 数字 图 像 的 概念 出 
发 ,介绍 了 数字 图 像 和 数字 图 像 处 理 技术 的 基本 概念 ,以 及 机 器 视觉 技术 的 相关 理论 ,对 数字 
图 像 处 理 与 机 器 视觉 技术 的 研究 现状 和 未 来 发 展 前 景 做 了 阐述 。 通 过 本 章 的 学 习 , 可 以 使 读 
者 对 数字 图 像 处理 的 方法 和 机 需 视 党 系统 的 组 成 ,作用 有 一 定 的 了 解 。 





简 述 像素 ( 像 元 ) 及 数字 图 像 的 概念 ,并 说 出 你 知道 的 数字 图 像 有 哪些 种 类 。 
数字 图 像 处 理 系统 由 哪些 部 件 组 成 ? 

常见 的 数字 图 像 处 理 技术 包括 哪些 ? 

典型 的 工业 机 器 视觉 系统 包括 哪些 ? 

列举 几 个 身边 的 机 器 视觉 技术 应 用 的 案例 。 

. 结合 实际 应 用 谈 谈 数字 图 像 处 理 的 作用 。 


QN UA A U N 一 


C MA RE 


第 2 章 机 器 视觉 硬件 技术 


2.1 前 


m} 


一 个 典型 的 机 器 视觉 应 用 系统 包括 光源 、 光 学 镜头 、 摄 像 机 、 图 像 采 集 卡 、 图 像 处 理 系统 
(或 平台 )、 机 器 视觉 软件 模块 .输入 输出 和 控制 执行 模块 等 部 件 。 本 章 分 别 对 光源 技术 .光学 
镜头 技术 摄像 机 技术 、 图 像 采集 技术 、 摄 像 机 标定 技术 、TMS320DM642 DSP 图 像 处 理 系统 等 
机 器 视觉 技术 进行 详细 阐述 。 


2.2 光源 技术 


2.2.1 光源 的 特点 与 发 展 


照明 系统 是 机 器 视觉 应 用 系统 最 关键 的 部 分 之 一 ,其 主要 目标 是 以 合适 的 方式 将 光线 投 
射 到 被 测 物 体 上 ,突出 被 测 特征 部 分 对 比 度 , 在 系统 中 有 非常 重要 的 作用 ,直接 关系 到 整个 机 
能 视觉 系统 的 成 败 。 光 源 是 照明 系统 的 核心 设备 ,直接 作用 于 机 器 视觉 系统 的 输入 ,光源 的 选 
择 直 接 决定 图 像 特征 的 采集 以 及 后 续 算 法 的 复杂 度 ,而 合适 的 光源 以 及 照明 技术 有 助 于 采集 
到 特征 明显 的 图 像 信 息 ,改善 整个 系统 的 分 辩 率 ,简化 软件 的 运算 ,进而 使 机 器 视觉 系统 达到 
最 优化 。 

好 的 光源 设计 ,在 突出 图 像 特 征 的 同时 能 够 抑制 干扰 特征 ,在 获得 清晰 的 对 比 信息 、 提 高 
信 噪 比 的 同时 减少 因 光 源 位置 以 及 物体 高 速 运动 带 来 的 不 确定 性 。 而 不 恰当 的 光源 设计 会 造 
成 非 均匀 照明 ,进而 造成 图 像 亮 度 不 均匀 ,使 图 像 特征 和 背景 特征 混淆 ,难以 区 分 ,增加 干扰 。 
在 处 理 过 程 中 ,由 于 光源 不 当 产生 的 花 点 和 过 度 曝光 会 隐藏 很 多 重要 信息 ,阴影 会 引起 边缘 的 
误 检 ,而 信 噪 比 的 降低 以 及 不 均匀 的 照明 会 导致 图 像 处 理 阔 值 选择 的 困难 ,这 些 都 会 增加 后 期 
算法 设计 的 难度 和 复杂 度 。 在 设计 过 程 中 ,对 于 每 种 不 同 的 检测 对 象 ,必须 采用 不 同 的 照明 方 
式 才 能 突出 被 测 对 象 的 特征 ,有 时 可 能 需要 采取 几 种 方式 的 结合 ,而 最 佳 的 照明 方法 和 光源 的 
选择 往往 需要 大 量 的 试验 才能 找到 。 因 此 ,为 了 获得 优质 稳定 的 图 像 ,必须 从 照明 光源 中 选择 
最 为 适合 的 光源 。 而 且 大 多 数 情况 下 ,要 针对 具体 应 用 场合 设计 能 获取 优质 稳定 图 像 的 照明 

目前 机 名 视觉 照明 技术 的 发 展 已 非常 成 熟 。 日 本 的 CCS 公司 成 立 于 1992 年 ,致力 于 图 
像 处 理 的 LED 光源 的 开发 .设计 、 制 造 和 销售 。 近 年 来 ,各 种 图 像 处 理 设备 以 其 高 性 能 、 低 价 
格 不 断 在 市 场 上 出 现 ,CCS 公司 产品 所 应 用 的 领域 越 来 越 广 ,例如 表面 探测 、 位 置 的 确定 以 及 
产品 的 整合 。 该 公司 所 研究 制造 的 LED 光源 有 直接 照明 光源 (沐浴 方式 、 低 角度 方式 、 条 形 方 
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式 、 聚 光 方 式 ) 间接 照明 光源 ( 低 角 度 方式 .扁平 环形 方式 . 圆 顶 方式 )、 透射 照明 光源 (背光 方 
式 线形 方式 ) 、 同 轴 照 明光 源 ( 同 轴 方 式 ) 、 特 殊 照 明光 源 ( 平 行 光 光 学 单元 、 多 种 用 途 的 照 
明 ) 等 。 

美国 AI( Advanced Illumination ) 公司 成 立 于 1993 年 ,致力 于 机 器 视觉 照明 技术 的 开发 和 
研究 ,他 们 有 先进 的 LED 光源 照明 技术 ,所 生产 的 光源 有 背光 源 、 宽 领域 线 光源 、 同 轴 光 源 、 
点 光源 . 线 光源 等 。 他 们 利用 自己 在 机 器 视觉 照明 方面 的 优势 来 改进 机 器 视觉 系统 的 
应 用 。 

MORITEX 会 社 是 日 本 著名 的 光电 设备 仪器 制造 企业 ,包括 半导体 电子、 医疗. 通信 、 生 物 
工程 .精密 机 电机 器 制造 的 许多 高 精 尖 领 域 。 其 在 我 国有 很 多 经 销 商 ,如 北京 凌云 光 视 图 像 技 
术 公 司 等 。 

对 比 以 上 产品 ,日 本 制造 的 光源 小 巧 ,美国 制造 的 光源 产品 结实 ,另外 还 提供 控制 软件 。 
日 本 光源 外 观 精致 ,因为 选用 的 LED 小 ,所 以 排列 紧密 ;美国 同类 产品 的 LED 体积 大 ,所 以 排 
列 时 通过 精确 控制 LED 的 光 轴 来 确保 光线 均匀 。 总 的 来 说 ,机 器 视觉 照明 技术 正 处 在 一 个 迅 
速 发 展期 , 随 着 市 场 的 发 展 ,未 来 的 图 像 处 理 技 术 必 须 依赖 于 照明 技术 的 同步 发 展 。 

在 机 器 视觉 系统 中 ,有 效 的 光源 和 照明 应 当 具 有 以 下 特征 。 

(1) 尽 可 能 突出 目标 的 特征 ,在 物体 需要 检测 部 分 与 非 检测 部 分 之 间 尽 可 能 具有 明显 的 
区 别 , 增 加 对 比 度 。 

(2) 能 够 保证 足够 的 亮度 和 稳定 性 。 

(3) 物 体位 置 的 变化 不 应 该 影响 成 像 的 质量 。 

2.2.2 ”光源 系统 模型 

光源 系统 设计 不 仅 需 要 调整 光源 本 身 的 参数 ,还 需要 考虑 到 应 用 场合 的 环境 因素 和 被 测 
物 的 光学 属性 。 

(1) 光 学 系统 的 参数 

通常 ,光源 系统 设计 可 控制 的 参数 有 以 下 5 种 ,这 里 给 出 基本 定义 。 

GD 方向 :主要 有 直射 和 散射 两 种 方式 ,其 主要 取决 于 光源 类 型 和 放置 位 置 。 

@) 光 谱 : 即 光 的 颜色 ,其 主要 取决 于 光源 类 型 和 光源 或 镜头 滤 光 片 的 性 质 。 光 源 的 光谱 用 
色温 进行 度量 ,色温 是 指 当 某 一 种 光源 的 光谱 分 布 与 在 某 一 温度 下 的 完全 辐射 体 (黑体 ) 的 光 
谱 分 布 相同 时 完全 辐射 体 ( 黑 体 ) 的 温度 。 

@ 极 性 : 即 光波 的 极 性 ,镜面 反射 光 有 极 性 ,而 漫 反射 光 没有 极 性 。 可 在 镜头 前 加 一 滤 光 
片 消除 镜面 反射 光 。 

OIRRE CIRA E S KER RR KI XT EE RE, 而 光 强 过 大 则 会 导致 功 耗 大 ,并 且 需 散热 
处 理 。 

@ 均 匀 性 ;是 机 器 视觉 系统 的 基本 要 求 。 但 当 光 源 随 距 离 和 和 角度 增 大 时 光 强 衰减 。 

(2) 物 理光 学 属性 

主要 物理 光学 属性 包括 以 下 7 个 方面 ,属于 物理 学 范畴 ,这 里 做 简单 介绍 。 

中 反射 :主要 有 镜面 反射 和 漫 反 射 两 种 类 型 。 

@) 投 射 : 其 取决 于 物体 的 材料 构成 和 厚度 。 
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G@) 折 射 :主要 存在 于 透明 材料 中 。 

DORE :投射 或 反射 光 能 的 光谱 分 布 。 

@ 纹 理 : 可 用 光照 来 进行 增强 或 衰减 。 

@) 高 度 : 直 射 照明 可 增强 高 度 信息 ,而 散射 照明 可 减弱 高 度 信息 。 

GO 表面 方向 :直射 照明 可 增强 表面 方向 信息 ,而 散射 照明 可 减弱 表面 方向 信息 。 

2.2.3 常用 典型 光源 及 应 用 

机 器 视觉 系统 中 典型 光源 包括 前 光源 、 背 光源 、 环 形 光 源 、 点 光源 以 及 可 调 光 源 ,下面 针对 
几 种 光源 做 简单 介绍 和 说 明 。 

(1) 前 光源 

放置 在 被 检测 物体 前 面 的 光源 就 叫 前 光源 ,按照 明 方 式 又 可 以 被 称 为 前 方式 照明 。 根 据 
光源 与 待 检 测 物 体 表面 的 夹 角 的 不 同 ,前 光源 照明 可 以 分 为 高 角度 照明 和 低 角 度 照 明 两 种 。 
选取 高 角度 还 是 低 角 度 照明 方式 ,依据 待 检测 物体 的 表面 待 测 部 分 的 机 理 的 不 同 而 异 。 例 如 ， 
当 被 测 物体 表面 采用 刻字 式 字符 时 ,我们 可 以 考虑 效果 更 好 的 低 角 度 照 明 , 当 采用 印刷 式 字 符 
时 ,选取 高 角度 照明 效果 会 更 好 。 

前 光源 适合 于 检测 不 平整 与 反光 的 表面 ,比如 包装 袋 或 者 封 盖 的 印记 、PCB 板 上 的 元 件 、 
检测 芯片 上 的 印刷 字符 以 及 一 些 橡胶 类 产品 等 。 

(2) 背 光源 

背光 源 放置 在 竺 检测 物体 的 背面 ,这 一 点 与 前 光源 的 放置 位 置 刚 好 相反 。 使 用 背光 源 照 
射 被 测 物体 ,形成 不 透明 物体 的 阴影 使 得 被 检测 物体 透 光 与 不 透 光 的 边缘 清晰 ,有 利于 后 续 的 
边缘 提取 。 因 此 背光 源 可 以 用 来 检测 物体 的 轮廓 .透明 物体 污点 和 缺陷 轴承 或 者 小 型 电子 器 
件 尺 寸 和 外 形 等 。 

(3 ) 环形 光源 

环形 光源 的 特点 是 可 为 被 检测 物体 提供 面积 大 而 且 均 衡 的 照明 ,在 实际 的 机 器 视觉 系统 
应 用 中 ,一 般 会 与 CCD 镜头 同 轴 安 放 。 当 与 被 检测 物体 之 间 的 距离 合适 时 ,环形 光源 可 以 使 
明 影 大 大 减少 、 增 加 被 测 物 体 的 对 比 度 ,从 而 可 以 实现 大 面积 的 荧光 照明 。 其 缺点 就 是 距离 不 
合适 时 ,会 有 环形 反光 的 现象 存在 。 

环形 光源 非常 适合 检测 高 反射 材料 表面 的 缺陷 ,尤其 适合 检测 电路 板 与 BGA 的 缺陷 。 因 
此 环形 光源 可 以 广泛 地 应 用 在 有 纹理 表面 的 物体 测量 ,例如 IC 芯片 上 的 印刷 字符 .印刷 电 路 
板 上 的 零件 .各 种 产品 标签 等 。 

(4) 点 光源 

点 光源 的 结构 比较 紧凑 ,可 以 把 光线 集中 在 一 个 一 定 距 离 的 小 视 场 内 ,给 被 检测 物体 提供 
均匀 而 又 明亮 的 光照 ,从 而 提高 图 像 的 对 比 度 。 通 常 ,点 光源 是 从 正 对 面 以 一 定 的 角度 照射 待 
测 物体 上 感 兴趣 的 区 域 ,由 于 点 光源 的 光线 均匀 且 亮 度 高 ,使 得 采集 到 的 图 像 对 比 度 高 ,非常 
适合 于 检测 被 检测 物 表面 上 的 阴影 、 缺 陷 甚 至 是 微小 的 凹陷 。 因 此 ,点 光源 通常 被 用 于 凸轮 齿 
轮 损 伤 缺陷 条形码 识别 以 及 激光 打印 字符 等 行业 的 检测 。 

(5) 可 调 光 源 

可 调 光 源 是 通过 电流 调整 名 亮度 控制 器 或 者 是 频 闪 控制 器 调整 光源 亮度 和 频 闪 速度 的 
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光源 , 它 为 机 器 视觉 系统 中 光源 设计 提供 了 更 多 的 选择 。 

2.2.4 ”光源 选择 指标 

机 器 视觉 系统 中 的 光源 ,要 满足 以 下 4 项 指标 。 

(1) 亮 度 

亮度 对 机 器 视觉 的 检测 最 为 重要 。 工 作 面 的 亮度 至 少 应 稍 高 于 周围 环境 亮度 。 当 光源 不 
够 亮 时 ,可 能 有 如 下 三 种 情况 出 现 : 

DCCD 的 信 噪 比 不 够 。 由 于 光源 的 亮度 不 够 ,图 像 的 对 比 度 必 然 不 够 ,在 图 像 上 出 现 噪 
声 的 可 能 性 也 随即 增 大 。 

@ 当 光源 的 亮度 不 够 时 ,自然 光 等 随机 光 对 系统 的 影响 会 很 大 。 

@ 光 源 的 亮度 不 够 ,必然 要 加 大 光圈 ,从 而 减 小 景深 。 

(2) 对 比 度 

对 比 度 定义 为 在 特征 区 域 与 其 周围 的 区 域 之 间 有 足够 的 灰 度 量 区 别 。 对 比 度 与 光源 的 亮 
HE .颜色 和 竺 检测 面 的 反射 率 有 关 。 如 两 个 反射 面具 有 相似 的 反射 率 , 则 它们 的 对 比 度 将 非 
常 低 , 反 之 则 有 较 高 的 对 比 度 。 作 为 光源 的 设计 者 ,能 控制 的 因素 是 光源 的 亮度 和 光源 的 
颜色 。 通 过 调整 光源 的 亮度 并 选择 合适 的 光源 颜色 (如 用 红色 LED 光源 可 获得 较 理 想 的 灰 
度 图 像 ) ,使 需要 被 观察 的 特征 与 需要 被 忽略 的 图 像 特征 之 间 产 生 最 大 的 对 比 度 , 从 而 易于 特 
征 的 区 分 。 

(3) 均 匀 性 

光源 的 均匀 性 主要 取决 于 LED 制造 .封装 工艺 。 不 均匀 的 光 会 造成 不 均匀 的 反射 ,在 摄 
像 头 视野 范围 内 的 部 分 ,光源 应 该 是 均匀 的 。 图 像 中 上 暗 的 区 域 的 产生 原因 是 缺少 反射 光 , 而 亮 
点 的 区 域 则 是 此 处 反射 光 太 强 所 致 。 不 均匀 的 光 会 使 视野 范围 内 部 分 区 域 的 光 比 其 他 区 域 
多 ,从 而 造成 物体 表面 反射 不 均匀 (假设 物体 表面 对 光 的 反射 是 相同 的 )。 均 匀 的 光源 会 
补偿 物体 表面 的 角度 变化 ,即使 物体 表面 的 几何 形状 不 同 ,光源 在 各 部 分 的 反射 也 是 均 
匀 的 。 

(4) BETE 

光源 的 鲁 棒 性 是 测试 光源 是 否 对 位 置 变化 敏感 的 一 个 指标 , 它 与 光源 的 亮度 .对比度 . 均 
匀 度 有 紧密 的 联系 。 一 般 要求 将 光源 放置 在 摄像 头 视野 的 不 同 区 域 或 不 同 角 度 时 ,图 像 的 变 
化 应 非常 小 。 另 外 ,光源 在 实际 工作 中 与 其 在 实验 室 中 应 该 有 相同 的 效果 。 


2.3 光学 镜头 技术 


图 像 采集 设备 是 机 器 视 觉 系 统 的 重要 组 成 部 分 ,影响 到 系统 应 用 的 稳定 性 和 可 靠 性 。 图 
像 的 获取 实际 上 就 是 将 被 测 物体 的 可 视 化 图 像 和 内 在 特征 转换 成 能 被 计算 机 处 理 的 图 像 数 
据 。 在 机 器 视觉 中 ,镜头 的 作用 主要 是 将 目标 的 图 像 聚焦 在 图 像 传感器 的 光敏 面 上 ,从 而 将 图 
像 转化 为 电信 和 号 送 入 处 理 器 进行 处 理 。 镜 头 作 为 机 器 视觉 系统 的 输入 ,能 够 直接 影响 机 器 视 
觉 系 统 的 性 能 。 在 种 类 繁多 的 镜头 中 ,合理 的 选择 .安装 和 使 用 镜头 是 设计 机 器 视觉 系统 的 重 
要 环节 之 一 。 
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2.3.1 镜头 的 分 类 与 性 能 指标 


1) 镜头 分 类 

镜头 按 不 同 的 特征 有 不 同 的 分 类 。 一 般 可 按 焦距 、. 调 焦 方式 .光圈 分 类 。 按 焦距 分 类 可 分 
为 广角 镜头 ,标准 镜头 、 长 焦 镜头 等 ; 按 调 焦 方式 分 类 可 分 为 手动 调 焦 、 自 动 调 焦 等 ; 按 光 圈 分 
类 可 分 为 手动 光圈 和 自动 光圈 。 

2) 性 能 指标 

一 般 的 光学 镜头 的 性 能 指标 主要 由 焦距 分辨 率 、 视 场 角 和 光谱 特性 来 体现 。 在 选取 镜头 
时 ,可 以 根据 不 同 的 用 途 和 需要 进行 选择 。 

(1) 和 焦距 

焦距 是 光学 镜头 的 重要 参数 ,通常 用 f 来 表示 。 焦 距 的 大 小 决定 着 视 场 角 的 大 小 ,焦距 数 
值 越 小 , 视 场 角 越 大 ,所 观察 的 范围 也 越 大 ,但 距离 远 的 物体 分 辨 不 很 清楚 ;焦距 数值 越 大 , 视 
场 角 越 小 ,观察 范围 越 小 ,只 要 焦距 选择 合适 ,即便 距离 很 远 的 物体 也 可 以 看 得 清 清 楚楚 。 由 
于 焦距 和 视 场 角 是 一 一 对 应 的 ,一 个 确定 的 焦距 就 意味 着 一 个 确定 的 视 场 角 , 所 以 在 选择 镜头 
焦距 时 ,应 该 充分 考虑 是 观测 细节 重要 ,还 是 有 一 个 大 的 观测 范围 重要 。 如 果 要 看 细节 ,就 选 
择 长 焦距 镜头 ;如 果 看 近 距 离 大 场面 ,就 选择 小 焦距 的 广角 镜头 。 

(2) 分 辩 率 

分 辩 率 是 影响 图 像 效 果 的 重要 因素 ,一般 用 水 平和 垂直 方向 上 所 能 显示 的 像素 数 来 表示 ， 
例如 640 x480。 该 值 越 大 ,图 像 文 件 所 占用 的 磁盘 空间 越 大 ,从 而 图 像 的 细节 表现 得 也 越 
充分 

(3 ) 视 场 角 

镜头 的 视 场 角 决 定 了 图 像 传 感 器 成 像 的 空间 范围 , 它 与 光学 镜头 的 焦距 有 关 。 当 CCD 器 
件 尺寸 一 定时 ,焦距 越 长 ,其 视 场 角 越 小 。 

(4) 光 谱 特 性 

光学 镜头 的 光谱 特性 主要 指 镜 头 对 各 波段 光线 的 透 过 率 特性 。 在 部 分 机 右 视 觉 应 用 系统 
中 ,要 求 图 像 的 颜色 应 与 成 像 目 标的 颜色 具有 较 高 的 一 致 性 。 因 此 ,希望 各 波段 透 过 光学 镜头 
时 , 除 总 强度 有 一 定 损失 外 ,其 光谱 组 成 并 不 发 生 改 变 。 影 响 光学 镜头 光谱 特性 的 主要 因素 
为 : 膜 层 的 干涉 特性 和 玻璃 材料 的 吸收 特性 。 在 机 器 视觉 系统 中 ,为 了 充分 利用 镜头 的 分 辩 
率 , 镜 头 的 光谱 特性 应 与 使 用 条 件 相 匹配 。 要 求 镜头 最 高 分 辩 率 的 光线 应 与 照明 波长 .CCD 
器 件 接受 波长 相 匹配 ,并 使 光学 镜头 对 该 波长 的 光线 透 过 率 尽 可 能 高 。 

(5 ) 光 图 或 通 光量 

镜头 的 通 光量 以 镜头 的 焦距 和 通 光 孔径 的 比值 来 衡量 ,以 了 为 标记 ,每 个 镜头 上 均 标 有 
其 最 大 的 下 值 , 通 光 量 与 斑 值 的 平方 成 反比 关系 , 正 值 越 小 , 则 光圈 越 大 。 所 以 应 根据 被 监控 
部 分 的 光线 变化 程度 来 选择 用 手动 光圈 还 是 用 自动 光圈 镜头 。 

(6) 滤 光 镜 

自然 界 中 存在 着 各 种 波长 的 光线 ,通过 折射 ,人 眼 能 看 到 不 同 颜色 的 光线 ,这 就 是 光线 的 
波长 不 同 所 导致 的 。 人 有 眼 能 够 识别 的 光线 的 波长 范围 大 概 在 400 ~700nm 之 间 ,而 理论 上 通 
过 摄像 机 可 以 看 到 绝 大 部 分 波长 的 光线 。 但 这 在 摄像 机 的 使 用 过 程 中 就 出 现 了 一 个 问题 ,由 


图 像 处 理 与 机 器 视觉 


于 各 种 光线 摊 杂 ,这 样 通过 摄像 机 看 到 的 物体 就 会 产生 彩色 失真 。 为 解决 彩色 失真 的 问题 ,一 
般 会 在 镜头 上 安装 一 低 通 滤 光 镜 , 它 能 够 阻碍 红外 光 的 进出 , 故 能 在 白天 使 彩色 不 失真 。 

2.3.2 ”自动 调 焦 

自动 调 焦 技术 的 主要 任务 是 在 无 须 外 界 干预 的 情况 下 ,使 观测 设备 的 调 焦 过 程 能 够 自动 
实现 ,为 观察 者 提供 质量 清晰 边缘 及 细节 突出 的 图 像 。 从 目前 自动 调 焦 技术 的 发 展 来 看 , 自 
动 调 焦 技术 可 大 致 划分 为 两 大 类 .传统 自动 调 焦 技术 和 基于 图 像 的 自动 调 焦 技术 。 

1 ) 传 统 自动 调 焦 技术 

按照 有 无 探测 源 , 传 统 调 焦 技术 又 可 细 分 为 :主动 式 自动 调 焦 法 和 被 动 式 自动 调 焦 法 。 

(1) 主 动 式 自动 调 焦 法 。 最 早 应 用 在 调 焦 领域 中 的 就 是 主动 式 自动 调 焦 法 。 主 动 式 调 焦 
法 需要 通过 外 界 的 测量 设备 获得 信息 ,完成 调 焦 。 例 如 ,一 些 主动 式 调 焦 系统 就 是 主动 向 被 摄 
目标 发 出 红外 、 激 光 或 者 超声 波 等 ,由 光电 原件 接收 到 的 反射 信号 ,通过 一 定 的 算法 计算 出 与 
被 摄 物体 的 距离 ,再 由 高 斯 成 像 公式 确 定 像 距 和 焦距 的 调节 量 , 最 后 由 执行 机 构 完成 调 焦 。 常 
用 的 主动 式 自动 调 焦 法 有 :三角 测 距 法 红外线 测 距 法 和 超声 波 测 距 法 。 但 主动 式 自 动 调 焦 法 
也 有 一 定 的 次 端 ,比如 在 被 测 物体 能 够 吸收 发 射 信号 时 就 很 难 完成 对 目标 的 测 距 。 除 此 之 外 ， 
主动 式 自动 调 焦 法 也 存在 成 本 较 高 的 问题 。 

(2) 被 动 式 自动 调 焦 法 。 被 动 式 自动 调 焦 法 无 须 借助 外 界 设备 ,被 动 式 自动 调 焦 系统 通 
过 某 种 方法 被 动 地 测量 被 摄 目标 的 成 像 光 线 ,根据 调 焦 屏 上 的 成 像 情况 调节 像 距 或 (和 ) 焦距 
完成 调 焦 。 

被 动 式 自动 调 焦 法 按 原理 不 同 义 可 分 为 两 类 :一 类 是 基于 点 目标 或 平行 光 所 形成 的 模拟 
图 像 , 不 需要 发 射 系统 ,但 需要 和 额外 的 光电 检测 仪器 ,主要 有 对 比 度 检测 法 、 相 位 检测 法 和 调制 
传递 函数 法 等 ; 另 一 类 是 基于 面 阵 CCD 或 CMOS 等 固态 摄像 器 件 采集 到 的 数字 图 像 , 采 用 基 
于 图 像 处 理 的 方法 进行 自动 调 焦 ,该 方法 仅 依赖 于 所 获取 的 图 像 信 息 ,不 需要 额外 的 设备 支 
持 。 采 用 被 动 式 自 动 调 焦 法 时 ,被 摄 目 标的 一 些 因 素 , 比 如 亮度 、 对 比 度 和 图 形 轮 廓 , 均 会 影响 
调 焦 的 准确 性 。 

总 的 来 说 ,被 动 式 自动 调 焦 法 较 主 动 式 自动 调 焦 法 更 加 可 靠 , 对 焦 效 果 比 较 好 ,更 加 实用 。 

2) 基 于 图 像 处 理 的 自动 调 焦 方法 

目前 ,基于 图 像 处 理 的 自动 调 焦 技术 成 为 调 焦 领 域 的 热点 和 重要 发 展 方向 。 它 的 原理 是 
利用 PC 或 骨 入 式 系统 的 图 像 处 理 系 统 对 采集 到 的 图 像 进行 分 析 处 理 , 获 得 成 像 系 统 的 离 焦 
状态 ,以 此 制订 调 焦 方案 ,实现 自动 调 焦 。 基 于 图 像 处 理 的 自动 调 焦 方法 按 操作 的 不 同 又 分 为 
离 焦 深度 法 和 对 焦 深 度 法 。 

(1 ) 离 焦 深度 法 

离 焦 深 度 法 ( Depth from Defocus) 通 过 离 焦 图 像 来 获取 目标 的 深度 信息 。 在 处 理 时 ,需要 
获得 2 ~3 帧 不 同 离 焦 程度 的 图 像 ,通过 对 图 像 的 局 部 区 域 进 行 分 析 和 处 理 ,得 到 图 像 的 模糊 
程度 和 离 焦 深度 信息 ,进而 判断 对 焦 位 置 , 连 续 驱 动 镜 头 运 动 , 完 成 自动 调 焦 。 使 用 DFD 法 进 
行 调 焦 ,需要 知道 成 像 系统 的 各 种 参数 ,预先 建立 成 像 系统 的 数学 模型 ,才能 根据 少量 图 像 推 
算出 离 焦 深度 ,判断 对 焦 位 置 。 但 在 实际 应 用 中 ,目前 还 不 能 精确 确定 成 像 系统 的 数学 模型 ， 
并 且 由 于 采用 了 少量 图 像 , 信 息 量 少 ,因此 离 焦 深 度 法 可 能 导致 对 焦 失 败 或 者 误差 较 大 。 
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(2) 对焦 深度 法 

对 焦 深 度 法 (Depth from Focus) 是 基于 图 像 清晰 度 评价 函数 计算 值 的 方法 。 对 焦 深 度 法 
根据 特有 的 图 像 清 晰 度 评价 函数 ,计算 在 不 同 焦点 时 图 像 的 清晰 程度 ,同时 使 图 像 在 成 功 对 焦 
时 清晰 度 最 高 ,从 而 控制 对 焦 设备 向 清晰 度 最 高 的 位 置 运动 。 对 焦 深 度 法 适用 范围 广 , 调 焦 控 
制 电路 也 比较 简单 ,是 一 种 比较 实用 的 对 焦 方式 。 但 是 ,采用 对 焦 深 度 法 的 前 提 是 图 像 清晰 度 
评价 函数 必须 有 界 而 且 存在 峰值 , 且 在 峰值 两 侧 函 数 都 是 单调 的 。 在 实际 中 ,由 于 受 干扰 信和 号 
的 影响 ,可 能 无 法 保证 峰值 时 不 受信 号 干扰 ,也 无 法 保证 在 峰值 两 侧 函 数 单调 。 


2.4 摄像 机 技术 


2.4.1 CMOS 和 CCD 图像 传 感 器 


摄像 机 是 将 光 图 像 转变 为 电信 号 ,为 系统 提供 视频 图 像 信 号 的 最 重要 设备 。 摄 像 机 技术 
经 历 了 从 黑白 摄像 机 到 彩色 摄像 机 、 从 摄像 管 摄像 机 到 CCD 摄像 机 、 从 模拟 摄像 机 到 全 数字 
摄像 机 的 发 展 。 摄 像 机 技术 作为 机 器 视觉 系统 图 像 采集 中 最 重要 的 一 环 ,对 整个 系统 的 性 能 
有 着 重要 的 影响 。 

在 图 像 传感器 领域 , 目前 应 用 最 广 和 发 展 最 快 的 两 类 固态 图 像 传感器 分 别 是 :互补 金属 氧 
化 物 半 导体 CMOS PHRA IRAE AIE HARA ARE CCD 图 像 传感器 。 

CCD 的 发 展 已 经 有 50 多 年 ,其 性 能 得 到 了 大 幅 提 升 ,加 之 CCD 图 像 传感器 固有 的 灵敏 度 
高 .噪声 低 、 像 素 单 元 面积 小 等 优点 ,因而 一 直 占 据 着 图 像 传 感 器 市 场 的 主导 地 位 。CMOS 和 
CCD 几乎 是 同时 产生 的 ,但 受 当 时 工艺 水 平 限制 ,CMOS 图 像 传感器 因 图 像 质量 差 分辨 率 低 、 
噪声 降 不 下 来 和 光照 灵敏 度 不 够 ,因而 没有 得 到 重视 和 发 展 。 自 19 世纪 80 年 代 , 以 来 ,由 于 
CMOS 技术 的 迅速 发 展 ,CMOS 图 像 传感器 也 得 到 了 快速 发 展 。CMOS 图 像 传 感 器 自身 的 高 集 
成 度 、 低 功 耗 、 低 成 本 和 高 抗 辐射 等 优越 性 也 使 得 它 在 图 像 和 机 器 视觉 等 领域 的 应 用 越 来 越 
] €. 

下 面 我 们 对 CCD 和 CMOS 的 工作 原理 和 结构 性 能 进行 详细 比较 说 明 。 

1)CCD 技术 

CCD 是 由 按照 一 定 规律 紧密 排列 起 来 的 金属 一 绝缘 体 一 半导体 (MIS) 电容 阵列 组 成 的 一 
种 光电 转换 器 件 。 它 以 电荷 包 的 形式 存储 和 传送 信息 ,主要 由 光敏 单元 .输入 结构 和 输出 结构 
等 部 分 组 成 ,具有 光电 转换 、 信 息 存储 和 延 时 等 功能 。CCD 传感器 可 以 用 来 感应 可 见 光 的 强 
度 。 数 码 相 机 中 所 用 的 CCD 是 一 个 CCD 二 维 阵列 ,外 形 和 大 小 与 计算 机 的 数字 电路 芯片 相 
似 ,CCD 阵列 安排 在 芯片 表面 。CCD 在 数码 相机 中 设置 在 传统 相机 的 底片 位 置 ,其 作用 就 像 
传统 相机 的 底片 一 样 ,在 镜头 的 焦点 位 置 感应 光线 的 强 弱 。 可 以 将 CCD 想象 成 一 颗 颗 微小 的 
感光 粒子 , 铺 满 在 光学 镜头 的 后 方 , 当 光 源 发 出 的 光 人 射 到 CCD 的 光敏 面 上 时 ,首先 完成 光电 
转换 , 即 产 生 与 人 射 光 辐 射 量 呈 线性 关系 的 光电 荷 ,此 电荷 存储 在 MOS 存储 单元 中 。 在 外 加 
一 定时 序 的 驱动 脉冲 作用 下 ,CCD 中 存储 的 电荷 一 个 接 一 个 地 顺序 移出 ,这 样 ,在 CCD 的 
Vout 输出 管 脚 会 有 与 光电 荷 量 成 正比 的 弱电 压 信号 产生 。 通 常 ,CCD 阵列 的 像素 数目 越 多 ， 
收集 到 的 图 像 就 会 越 清晰 ,图像 分 辩 率 也 越 高 。 从 CCD 概念 的 提出 到 商品 化 电荷 斐 合 摄像 机 
的 出 现 仅仅 经 历 了 四 年 。 近 年 来 ,CCD 以 其 线性 良好 、 量 子 效率 高 动态 范围 大 以 及 模拟 兼 数 
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字 化 等 优点 ,在 信和 号 处 理 及 图 像 传 感 领域 发 挥 了 巨大 的 作用 。CCD 以 其 无 可 比拟 的 优点 , 逐 
渐 成 为 现代 光电 技术 和 现代 测试 技术 领域 最 有 发 展 前 途 的 技术 手段 之 一 。 

从 结构 上 划分 ,CCD 可 分 为 线 阵 和 面 阵 两 大 类 : 线 阵 型 摄取 一 维 的 线 图 像 ; 面 阵 型 摄取 二 
维 的 面 图 像 。 线 阵 CCD 将 接收 到 的 一 维 光 电信 和 号 转换 成 一 定时 序 的 电 输 出 信号 ,获得 一 维 图 
像 信 号 ,在 一 维 方向 上 的 补偿 与 校正 易于 实现 ,因此 常 作为 一 种 高 精度 光电 传感器 ,广泛 应 用 
于 生产 线 上 的 产品 外 形 尺 寸 非 接触 测量 、 分 类 、 表 面 质量 评定 和 精确 定位 。 二 维 面 阵 的 CCD 
可 以 应 用 于 数码 相机 、 光 学 扫描 仪 与 摄像 机 的 感光 元 件 中 ,其 光 效 率 可 达 70% , 优 于 传统 底片 
的 2% 。 数 码 相 机 和 扫描 仪 的 核心 是 一 个 高 分 辩 率 的 CCD 阵列 ,用 于 采集 静止 图 像 ;CCD 在 
摄像 机 里 也 是 一 个 极其 重要 的 部 件 , 它 起 到 将 光线 转换 成 电信 号 的 作用 ,类 似 于 人 的 眼睛 ,用 
于 采集 视频 图 像 ,因此 其 性 能 的 好 坏 将 直接 影响 到 摄像 机 的 性 能 。 

(1)CCD 的 基本 结构 和 工作 原理 

电荷 的 产生 与 存储 

构成 CCD 的 基本 单元 是 半导体 MOS 结构 (金属 一 氧化 物 一 半导体 ) ,如 图 2-1 所 示 。 在 
一 定 的 偏 压 下 ,MOS 结构 成 为 可 存储 电荷 的 分 立 势 阱 。 当 在 栅 极 上 加 正 偏 压 Us 后 ,导体 内 的 
空 穴 被 排 空 ,产生 耗 尽 区 (此 时 Us 小 于 半导体 的 阔 值 电压 Ui, ) 。 当 Us > Ui 时 ,半导体 与 绝缘 
体 表面 上 的 电势 如 此 之 高 ,以 至 于 将 半导体 体内 的 电子 吸引 到 表面 ,形成 一 层 极 薄 但 电荷 浓度 


很 高 的 反 型 层 ,如 图 2-lc) 所 示 。 反 型 层 的 存在 表明 了 MOS 结构 存储 电荷 的 基本 功能 。 
氧化 层 。 杨 电 极 G TE 
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图 2-1 CCD 的 基本 单元 MOS 结构 存储 电荷 示意 图 


光照 射 到 CCD 硅 片 上 时 ,在 栅 极 附近 的 半导体 体内 产生 电子 空 穴 对 ,其 多 数 载 流 子 被 栅 
极 电 压 排 开 ,少数 载 流 子 则 被 收集 在 势 阱 中 形成 信号 电荷 。 信 和 号 电荷 产生 数量 的 多 少 ,直接 与 
入 射 光 的 强度 及 硅 片 曝光 时 间 成 正比 。 

@) 电 荷 的 耦合 ( 即 信号 转移 部 分 ) 

MOS 结构 势 阱 中 的 电荷 从 一 个 电极 移 向 另 一 个 电极 的 过 程 , 称 为 电荷 耦合 ,如 图 2-2 所 
示 。 以 图 中 4 个 临近 的 电极 为 例 ,开始 时 在 第 @ 个 电极 的 势 阱 中 存 有 部 分 电荷 ,其 他 电极 上 均 
加 有 大 于 阅 值 的 较 低 的 电压 [图 2-2a) 中 所 加 电压 为 2V] 。 当 第 @ 电 极 保 持 10V 不 变 ,第 3 电 
极 上 的 电压 变 为 10V 时 ,由 于 两 个 电极 之 间 的 距离 很 小 ,使 得 第 @@ 和 第 @ 电 极 下 的 势 阱 合并 
在 一 起 ,如 图 2-2b) 所 示 ,原来 第 @ 电 极 下 的 势 阱 中 的 电荷 变 为 共有 ,如 图 2-2c) 所 示 。 随 后 ， 
第 @) 电 极 上 所 加 电压 变 为 2V 时 ,原来 共有 的 电荷 向 第 @ 电 极 下 的 势 阱 移动 ,如 图 2-2d) 所 示 。 
等 到 原来 共有 的 电荷 全 部 移动 到 第 @ 电 极 下 的 势 阱 中 时 [ 如 图 2-2e) 所 示 ] 就 完成 了 一 次 电荷 
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包 的 移动 。 这 样 , 按 一 定 规律 变化 的 电压 加 在 CCD 的 电极 上 ,电极 下 的 电荷 包 就 能 按 一 定 的 
规律 移动 。 

通常 把 CCD 电极 分 为 几 组 ,每 一 组 为 一 相 , 并 施加 同样 的 时 钟 脉冲 ,如 图 2-2f) 为 三 相 
CCD 所 需 施加 的 时 钟 脉 冲 。 这 样 就 实现 了 电荷 在 势 阱 中 的 转移 。 
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d) e) f) 
K 2-2 三 相 CCD 中 电荷 的 转移 过 程 

@) 电 荷 检测 

光照 射 到 CCD 硅 片 上 产生 的 电荷 经 势 阱 传输 到 CCD 末端 的 外 存储 器 中 ,经 过 电荷 计数 
后 转换 成 电流 或 电压 信号 ,再 转换 成 数据 ,输入 计算 机 后 保存 。 目 前 CCD 的 输出 方式 主要 有 
电流 输出 、 浮 置 扩散 放大 器 输出 和 浮 置 机 放大 输出 。 

一 个 CCD 芯片 由 几 百 甚至 上 万 个 光敏 微 元 组 成 ,这 些微 元 组 合成 线 阵 或 面 阵 CCD 探测 
器 , 当 被 测 目 标的 光 信号 通过 光学 系统 在 CCD 光敏 元 上 成 像 时 ,CCD 器 件 便 将 光敏 元 上 的 光 
信和 号 转换 成 与 光 强 成 正比 例 的 电荷 量 。 用 一 定 频率 的 时 钟 脉冲 对 CCD 进行 驱动 ,在 CCD 的 
输出 端 便 可 获得 被 测 目 标的 视频 信号 。 视 频 信号 中 的 每 一 个 离散 信号 的 大 小 对 应 于 其 中 一 个 
光敏 元 所 接收 光 强 的 强 弱 ,而 信号 输出 的 时 序 则 对 应 着 CCD 光敏 元 位 置 的 顺序 。 这 样 ,CCD 
用 自身 扫描 方式 完成 了 信息 从 空间 域 到 时 间 域 的 转换 。 

(2) CCD 传感器 分 类 

CCD 图 像 传 感 器 按照 光敏 单元 的 排列 方式 
可 以 分 为 两 大 类 ; 线 阵 CCD 和 面 阵 CCD。 线 阵 
CCD 的 感光 单元 只 有 一 列 ,一 次 感光 只 能 采集 一 
行 图 像 数据 ; 面 阵 CCD 的 感光 单元 为 一 个 平面 ， 
一 次 感光 可 以 将 整个 被 摄 对 象 的 图 像 保存 下 来 。 

DRE CCD 图 像 传 感 器 

典型 的 线 阵 CCD 芯片 的 结构 如 图 2-3 所 示 。 . 存储 区 GEH) 
它 是 由 一 列 光敏 列 阵 和 与 之 平行 的 两 个 移 位 寄存 图 23 ”典型 线 阵 CCD 结构 示意 图 


转移 机 
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器 组 成 ,属于 双 通 道 型 。 该 器 件 的 转移 栅 将 光敏 区 和 存储 区 分 开 ,通过 转移 栅 的 控制 可 以 同时 
将 一 帧 图 像 所 对 应 的 电荷 由 光敏 区 转移 到 存储 区 。 它 是 由 阵列 光敏 曝光 一 定时 间 后 ,在 相应 
驱动 脉冲 作用 下 ,转移 栅 交 蔡 地 把 信号 电荷 转移 至 两 侧 的 移 位 寄存 器 ,再 由 移 位 寄存 器 一 位 一 
位 地 将 其 输出 ,从 而 得 到 所 需 的 光电 信息 。 

DHE CCD 图 像 传感器 

面 阵 CCD 多 用 于 采集 二 维 的 平面 图 像 , 它 有 和 多 种 类 型 。 常 见 的 结构 型 有 全 帧 转移 型 CCD 
( FFCCD) 、 帧 转移 型 CCD( FTCCD) 和 行 间 转 移 型 CCD(ILTCCD) ) 。 

全 帧 转移 型 CCD 其 由 并 行 CCD 转移 寄存 器 、 串 行 CCD 转移 寄存 器 和 感光 信和 号 输出 放大 
右 组 成 。 具 有 最 简单 的 结构 ,很 容易 制 成 和 操作 。 图 像 被 投射 到 平行 的 阵列 所 构成 的 成 像 平 
面 上 。CCD 器 件 取得 图 像 信息 ,并 把 图 像 划 分 成 由 像素 的 数量 所 决定 的 一 系列 离散 的 元 素 ， 
这 样 可 将 图 像 量子 化 。 生 成 的 图 像 的 列 信号 以 并 行 的 方式 转移 到 串 行 寄存 器 中 ,随后 再 由 串 
行 寄存 器 以 串 行 数据 流 的 形式 转移 输出 。 全 帧 转移 型 CCD 设计 的 简单 化 使 得 具有 高 分 辩 率 
和 高 密度 的 CCD 传感器 得 以 实现 。 

帧 转移 型 CCD 在 结构 上 与 全 帧 转移 型 CCD 很 相似 ,唯一 的 区 别 是 它 增 加 了 一 个 独立 的 
同样 的 并 行 寄存 器 , 称 为 存储 阵列 。 它 的 整个 思想 就 是 ,把 从 感光 部 分 或 者 成 像 阵列 获得 的 图 
像 很 快 地 转移 到 存储 阵列 中 ,之 后 图 像 信 息 从 存储 阵列 读 出 芯片 的 过 程 与 全 帧 转移 型 CCD 完 
全 一 致 ,在 这 个 过 程 中 ,存储 阵列 已 经 在 积分 下 一 帧 的 图 像 。 这 种 结构 的 优点 在 于 可 以 实现 连 
续 性 的 不 需要 快门 或 者 是 启动 信号 的 操作 ,因而 有 更 快 的 帧 速率 。 然 而 ,这 种 效果 是 折 中 性 
的 ,因为 在 图 像 信息 转移 到 存储 阵列 的 过 程 中 , 光 积 分 仍 在 进行 ,因而 产生 了 图 像 的 “ 拖 影 ”。 
实现 这 种 结构 需要 两 倍 的 硅 区 ,因此 帧 转移 型 CCD 与 全 帧 转移 型 CCD 相 比 ,具有 较 低 的 分 辩 
率 和 较 高 的 成 本 。 

行 间 转移 型 CCD 是 为 了 克服 帧 转移 型 CCD 的 缺点 而 设计 的 , 它 通过 在 非 感光 或 者 遮光 
的 平行 读 出 CCD 列 之 间 形 成 隔离 的 感光 区 的 方法 把 感光 和 读 出 作用 分 开 。 在 积分 了 一 幅 图 
像 后 ,每 个 像 元 积聚 的 信号 在 同一 时 刻 都 转移 到 遮光 的 并 行 读 出 CCD 中 。 之 后 的 转移 输出 与 
前 两 种 CCD 相似 。 在 读 出 的 过 程 中 ,和 同 帧 转移 型 CCD 一 样 ,下 一 帧 已 经 开始 积分 ,因而 能 
够 实现 连续 的 操作 ,获得 较 高 的 帧 速率 。 与 帧 转移 型 CCD 相 比 ,这 种 结构 可 以 显著 地 改善 读 
出 过 程 中 产生 的 图 像 的 “ 拖 影 "现象 。 但 它 的 复杂 性 又 导致 了 较 高 的 生产 成 本 和 较 低 的 灵敏 
VE ,灵敏 度 的 降低 是 因为 每 个 像 元 的 感光 区 域 的 减少 。 

2)CMOS 技术 

作为 固体 图 像 传感器 的 一 大 分 支 ,CMOS 传感器 的 研究 起 始 于 20 世纪 60 年 代 末 ,由 于 当 
时 受 工艺 技术 的 限制 ,直到 90 年 代 初 才 发 展 起 来 。CMOS 的 中 文 含义 是 互补 性 金属 氧化 物 半 
导体 ,CMOS 在 微 处 理 器 、 闪 存 和 特定 用 途 集成 电路 的 半导体 技术 上 占有 绝对 重要 的 地 位 。 
CMOS 图 像 传感器 是 利用 CMOS 工艺 制造 的 图 像 传感器 ,主要 利用 了 半导体 的 光电 效应 。 
CMOS 主要 是 利用 硅 和 钞 这 两 种 元 素 做 成 的 半导体 ,通过 CMOS 上 带 负 电 和 带 正 电 的 晶体 管 
来 实现 感受 光线 变化 的 功能 ,这 两 个 互补 效应 晶体 管 所 产生 的 电流 可 以 被 处 理 芯片 记录 和 和 解 
读 成 图 像 数 据 。CMOS 传感器 用 来 感应 可 见 光 的 光 强 时 ,通常 也 封装 成 阵列 形式 ,用 法 与 CCD 
阵列 基本 相同 。 

CMOS 的 结构 相对 简单 ,生产 工艺 与 现 有 的 大 规模 集成 电路 生产 工艺 相同 ,因此 生产 成 本 
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低 。 从 原理 上 讲 ,CMOS 的 信号 是 以 点 为 单位 的 电荷 信号 ,而 CCD 是 以 行为 单位 的 电流 信号 ， 
前 者 更 为 敏感 ,速度 也 更 快 ,更 为 省 电 , 使 信息 的 获取 和 转移 的 成 本 大 大 降低 ,并 能 给 出 直观 、 
真实 多 层次 .内容 丰 富 的 可 视图 像 信息 。 

普通 CMOS 传感器 ,存在 着 像素 大 、 信 噪 比 小 、 分 辩 率 低 等 缺点 ,一 直 无 法 和 CCD 技术 抗 
衡 , 因 而 被 应 用 在 低 端 .廉价 的 成 像 设 备 中 ,例如 网 络 电话 摄像 头 、 监 控 用 无 线 摄像 头等 。 然 
而 ,目前 高 端的 CMOS 已 经 推出 ,其 成 像 质量 并 不 比 一 般 的 CCD 差 ,在 专业 级 单 片 数码 相机 领 
域 ,CMOS 传感器 因 更 高 的 成 像 质量 而 被 广泛 采用 。 

(1)CMOS 结构 及 工作 原理 

CMOS 图 像 传感器 整体 结构 如 图 2-4 所 示 , 它 包括 像素 单元 阵列 、 模 拟 信号 处 理 器 、AZD 
转换 器 、 偏 置 电压 生成 单元 时 钟 生成 单元 .数字 逻辑 单元 和 存储 器 等 。 主 要 分 为 像素 单元 阵 
Jj] 模拟 信号 处 理 器 行列 驱动 器 \ 时 序 控制 逻辑 四 个 模块 。 


像素 单元 阵列 





图 2-4 CMOS 图 像 传感器 整体 结构 


CMOS 图 像 传 感 器 的 像素 单元 阵列 感光 并 且 能 够 将 光 信 和 号 转换 为 相关 的 电信 号 (如 电荷 、 
电流 或 电压 等 )。 根 据 光 生 载 流 子 理论 ,光子 进入 半导体 中 , 当 光 子 能 量 超过 带 际 能 量 时 就 会 
产生 电子 空 穴 对 。 在 电场 的 作用 下 ,电子 和 空 穴 会 被 分 开 , 其 中 电子 会 在 电势 阱 中 被 收集 , 空 
穴 则 会 被 遗弃 。 光 和 人 射 到 感光 区 时 ,会 发 生 光 电 效应 ,也 就 是 把 光 信 和 号 转换 成 电信 号 ,半导体 
价 带 中 受 束 缚 的 电子 在 接受 光 的 能 量 后 会 跃迁 到 导 带 ,成 为 能 够 自由 移动 的 电子 ,这 就 将 光 信 
号 转变 为 电信 号 。CMOS 图 像 传感器 的 像素 单元 阵列 可 以 一 次 对 一 行 或 者 一 列 数据 进行 采集 
或 者 读 取 。 

模拟 信号 处 理 模块 通常 可 以 具有 如 下 功能 :电荷 积分 ,变量 增益 控制 .采样 和 保持 、 相 关 双 
次 采样 和 提高 大 负载 驱动 电容 的 输出 缓冲 器 。CMOS 图 像 传感器 与 CCD 图 像 传 感 器 的 工作 
流程 大 体 一 致 ,区 别 在 于 信号 的 读 出 方式 不 同 。CCD 图 像 传 感 器 读 取 的 是 电荷 信号 ,而 CMOS 
图 像 传感器 读 取 的 却 是 电压 或 电流 信号。 

(2) 三 种 典型 像素 元 结构 的 CMOS 图 像 传感器 

目前 ,CMOS 图 像 传感器 可 分 为 三 种 基本 类 型 :无 源 像素 图 像 传 感 器 (Passive Pix Sensor, 
PPS) 有 源 像素 图 像 传感器 ( Active Pixel Sensor, APS) 和 数字 像素 图 像 传 感 器 ( Digital Pixel 
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Sensor, DPS) 。 
@ 无 源 像 素 图 像 传 感 需 结构 (PPS ) 
PPS 出 现 得 最 早 ,结构 也 最 简单 ,是 最 早 走向 实用 化 的 CMOS 图 像 传 感 器 。 其 结构 图 如 
dx 图 2-5 所 示 ,每 一 个 像素 单元 是 由 一 个 反 向 偏 置 的 光电 
二 极 管 ( MOS 管 或 p-n 结 二 极 管 ) 和 一 个 开关 管 TX 构 
成 。 当 开关 管 导 通 ,光电 二 极 管 中 由 于 光照 产生 的 电荷 
传送 到 列 线 。 位 于 列 线 未 端的 电荷 积分 放大 器 保持 列 线 
电压 为 一 常数 , 当 光 电 二 极 管 存储 的 信号 电荷 被 读 取 时 ， 
其 电压 被 复位 到 列 线 电 压 水 平 ,与 此 同时 , 列 线 下 端的 积 
列 线 分 放大 器 将 该 信号 转化 为 电压 输出 ,光电 二 极 管 中 产生 
图 2-5 ”光敏 二 极 管 无 源 像素 结构 的 电荷 与 光 信 和 号 呈 一 定 的 比例 关系 。 
PPS 结构 的 像素 可 以 设计 成 很 小 的 像 元 尺寸 , 它 的 结构 简单 填充 系数 高 (有 效 光 敏 面 积 
和 单元 面积 之 比 ) 。 由 于 填充 系数 大 多 没有 覆盖 一 层 类 似 于 在 CCD "PS E (A dh nS 
层 ) ,因此 量子 效率 ( 积累 电子 与 人 射 光 子 的 比率 ) 很 高 。 
但 是 这 种 结构 存在 着 两 方面 的 不 足 : 
第 一 ,各 像 元 中 开关 管 的 导 通 闭 值 难以 完全 匹配 ,所 以 即使 器 件 所 接收 的 入射 光线 完全 均 
匀 一 致 ,其 输出 信号 仍 会 形成 某 种 相对 固定 的 特定 图 形 ,也 就 是 所 谓 的 “ 纹 斑 品 声 ”( ER“ l 
有 模式 噪声 ”) ,致使 PPS 的 读 出 噪声 很 大 , 典型 值 为 250 个 均 方 根 电子 。 较 大 的 固有 模式 噪 
声 的 存在 是 其 致命 的 弱点 。 
第 二 ,光敏 单元 的 驱动 能 量 相 对 较 弱 , 故 列 线 不 宜 过 长 ,以 期 减 小 其 分 布 参数 的 影响 。 受 
多 路 传输 线 寄生 电容 及 读 出 速率 的 限制 ,PPS 难以 向 大 型 阵列 发 展 。 
@) 有 源 像素 图 像 传感器 结构 (PD-APS 和 PG-APS) 
有 源 像素 技术 是 在 每 一 个 像素 内 集成 一 个 或 多 个 放大 器 (有 源 髓 件 ) ,使 信号 在 像素 内 得 
到 放大 。 使 用 这 种 技术 的 CMOS 图 像 传 感 器 灵敏 度 高 .速度 快 ,并 具有 良好 的 消除 噪声 功能 。 
由 于 每 个 放大 器 在 读 出 期 间 被 激发 ,所 以 CMOS 有 源 像素 传感器 的 功 耗 比 CCD 图 像 传感器 的 还 
小 。APS 像 元 结构 复杂 ,与 PPS 像 元 结构 相 比 (无 源 像 元 的 孔径 效率 多 在 60% ~80% 之 间 ) ,其 
填充 系数 较 小 ,设计 填充 系数 典型 值 为 30% - 4096 ,与 行 间 转 移 CCD 接近 ,因而 需要 一 个 较 大 的 
单元 尺寸 。 随 着 CMOS 技术 的 发 展 ,CMOS 工艺 几何 设计 尺寸 日 益 减 小 ,填充 系数 将 不 会 成 为 限 
Hi APS 性 能 提高 的 因素 。 有 源 像素 图 像 传感器 主要 包括 光敏 二 极 管 型 和 光栅 型 两 类 。 
光敏 二 极 管 型 有 源 像素 结构 (PD-APS) 。 光 敏 二 极 管 型 有 源 像素 传感器 中 每 个 像 元 包括 
三 个 晶体 管 和 一 个 光敏 二 极 管 。 其 结构 如 图 2-6 所 示 。 图 2-6 中 ,输出 信号 由 源 跟随 器 予以 
缓冲 ,以 增强 像 元 的 驱动 能 力 , 其 读 出 功能 受 与 它 相 串联 的 行 选 晶 体 管 ( RS) 控制 。 由 于 源 跟 
随 器 不 再 具备 双向 导 通 能 力 , 故 需 另行 配备 独立 的 复位 晶体 管 (RST) 。 不 难 理解 ,由 于 有 源 像 
元 的 驱动 能 力 较 强 , 列 线 分 布 参数 的 影响 相对 较 小 ,因而 有 利于 制作 像 元 阵列 较 大 的 器 件 , 利 
用 独立 的 复位 功能 便于 改变 像 元 的 光电 积分 时 间 , 因 此 具有 电子 快门 的 效果 ,而 像 元 本 身 具备 
的 行 选 功 能 ,这 对 简化 二 维 输出 图 像 的 控制 电路 十 分 有 利 。 
光栅 型 有 源 像素 结构 (PG-APS) ,又 称 为 光 门 型 APS, PG-APS 结合 了 CCD 的 X-Y 寻 址 的 
优点 ,侧重 于 像素 内 部 信号 的 积分 传递 和 读 出 。 它 的 电荷 传递 和 相关 双 采 样 使 得 噪声 很 小 , 因 
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此 , 它 适用 于 高 性 能 、 低 光照 的 应 用 。 其 结构 如 图 2-7 所 示 。 光 门 型 APS 具有 一 个 很 大 的 多 晶 
硅 栅 , 它 会 产生 电势 阱 ( 耗 尽 区 ) 来 收集 光 生 电子 ,信号 电荷 在 PG 下 积分 。 读 出 时 先 对 浮 置 储 
存 节 点 进行 复位 ,此 时 它 的 电压 值 会 通过 源 跟随 器 被 读 出 。 当 PG 打开 时 ,电荷 被 传递 到 浮 置 
储存 节点 ,此 时 电压 会 有 变化 ,新 的 电压 值 会 被 读 出 ,复位 电压 与 信号 传递 后 电压 的 差 值 就 是 
像素 的 差 值 ,这 种 读 出 方法 也 叫 作 相关 双 采 样 。 





RST —] | 
au Mol 
X 7 列 
图 2-6 光敏 二 极 管 型 有 源 像素 结构 图 2-7 光栅 型 有 源 像素 结构 


@ 数 字 像 素 图 像 传 感 器 结构 ( DPS) 
数字 像素 图 像 传感器 是 一 种 新 型 的 CMOS 图 像 传感器 。 
数字 图 像 传感器 读 出 像素 为 数字 信和 号, 不同 于 无 源 像素 和 有 
源 像素 图 像 传感器 的 像素 读 出 为 模拟 信号 。 因 而 其 他 的 电路 = 
也 都 为 数字 逻辑 ,这 样 数字 图 像 传感器 读 出 速度 极 快 ,非常 适 S 
合 高 速 应 用 ,并 且 不 存在 器 件 噪声 对 其 产生 干扰 。 另 外 ,由 于 ” 友 
它 充分 利用 了 数字 电路 的 优点 ,因此 它 很 容易 随 着 CMOS 工艺 
的 进步 而 进行 等 比例 缩小 ,性 能 也 将 很 快 达到 并 超过 CCD 图 
像 传感器 ,并 且 可 以 实现 系统 的 单 片 集成 。 如 图 2-8 所 示 。 
2.4.2 数字 摄像 机 


数字 摄像 机 是 指 把 图 像 传感器 采集 到 的 数字 图 像 信号 直接 传送 给 后 端的 图 像 处 理 芯片 进 
行 处 理 ,无 须 进 行 传统 模拟 摄像 机 的 数字 图 像 信号 的 数 / 模 、 模 / 数 转换 过 程 , 这 样 就 避免 了 图 
像 信 号 数 / 模 转换 过 程 带 来 的 噪声 影响 。 下 面 对 数字 摄像 机 的 主要 参数 和 常见 的 术语 进行 详 
细 介 绍 。 

(1 ) 感光 元 件 

摄像 机 感光 元 件 是 摄像 机 的 核心 部 件 , 目前 摄像 机 常用 的 感光 元 件 有 CCD 和 CMOS 两 大 类 。 

CCD 和 CMOS 都 是 基于 MOS 结构 的 光电 转换 效应 进行 光电 转换 的 ,但 是 它们 对 光电 转换 
后 的 电荷 处 理 方式 不 同 ;CCD 通过 水 平和 垂直 的 转移 单元 传 载 电 荷 ,最 终 统一 在 负载 上 输出 
电压 信号 ;而 CMOS 通过 行列 解码 器 直接 输出 电压 信号 。 由 于 工作 方式 、 结 构 和 制造 工艺 的 差 
别 ,CMOS 传感器 比 CCD 体积 小 功 耗 低 、 集 成 度 高 。 

CCD 图 像 传感器 工作 原理 框图 如 图 2-9 所 示 。CCD 唤 件 完成 光电 转换 后 ,按照 其 像素 精 
度 存 储 与 光 像 对 应 的 “电荷 图 像 ” ,CCD 单元 内 的 电荷 包 在 场 消 隐 和 场 正 程 规 定 的 时 间 内 , 通 


图 2-8 数字 像素 结构 图 
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过 相 邻 CCD 遮光 的 垂直 移 位 寄存 单元 顺序 转移 到 行 输出 端 , 电 答 包 再 流 经 负载 输出 放大 为 模 
拟 电信 号 ,最 后 缓冲 输出 进行 后 续 的 信号 处 理 。 


摄像 机 (电路 板 ) 





图 2.9 电荷 耦合 器 件 图 像 传感器 工作 原理 
CMOS 图 像 传感器 的 工作 原理 框图 如 图 2-10 所 示 。 同 CCD 一 样 ,光电 转换 后 ,CMOS $8 
件 存 储 了 “电荷 图 像 ”。 但 每 个 “电荷 包 ” 都 独立 配 有 放大 器 和 A/D 电路 ,这 样 每 个 电荷 包 就 
被 直接 转换 成 了 数字 电信 号 。 最 后 ,通过 行列 寻 址 将 数字 信号 输出 。 
摄像 机 互补 金属 氧化 物 半导体 图 像 传 感 器 
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图 2-10 互补 金属 氧化 物 半 导体 图 像 传感器 工作 原理 


在 数据 输出 上 ,CCD 图 像 传感器 采用 串 行 方式 ,一 次 性 读 出 整 行 或 整 列 像素 的 电信 号。 
CMOS 图 像 传感器 信号 读 出 采用 邢 - 了 寻 址 方式 ,允许 以 整 块 .部 分 或 单元 为 单位 灵活 地 读 出 
数据 或 输出 任意 局 部 画面 。 能 有 效 减 小 图 像 数 据 处 理 量 ,便于 提高 图 像 帧 频 , 进 而 提高 寻 址 速 
BE, Wi CCD 图 像 传感器 串 行 信号 输出 的 方式 使 随机 窗口 读 取 的 能 力 受到 限制 。 

在 噪声 方面 ,CCD 的 特色 在 于 充分 保持 信号 传输 时 不 失真 ,每 一 个 像素 的 电荷 包 统 一 集 
合 至 单一 放大 器 上 处 理 , 保 持 图 像 的 完整 性 ;而 CMOS 像素 单元 直接 连 ADC ,信号 直接 放大 并 
转换 成 数字 信和 号。 一 般 情况 下 CMOS 的 噪点 比 CCD 多 ,会 影响 到 图 像 的 品质 。 

目前 ,CCD 图 像 传感器 主要 在 高 像素 分 辨 率 、 低 噪声 高 灵敏 度 的 高 画 质 需 求 领域 应 用 ， 
而 CMOS 图 像 传感器 主要 用 于 1.3M 像素 以 下 的 低 端 领域 , 即 价格 低 、 易 于 集成 .小 型 化 等 应 
用 领域 。 
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(2) 帧 速 

人 的 眼睛 有 视觉 残留 的 特性 ,就 是 光 对 视网膜 所 产生 的 视觉 在 光 停 止 作用 后 , 仍 保留 一 段 
时 间 的 现象 , 它 是 由 视神经 元 的 反应 速度 造成 的 ,其 时 值 是 二 十 四 分 之 一 秒 。 早 期 的 电影 就 是 
根据 这 一 特性 ,人 们 将 定格 的 照片 ,以 每 秒 一 定数 量 的 变换 来 产生 动态 的 效果 。 

帧 速 ,是 指 在 1s 时 间 里 传输 的 图 片 的 帧 数 ,也 可 以 理解 为 图 形 处 理 器 每 秒 刷新 的 次 数 , 通 
常用 FPS( Frames Per Second) 表示 。 高 的 帧 速 可 以 得 到 更 流畅 的 画面 ,每 秒 钟 帧 数 越 多 ,所 显 
示 的 动作 就 会 越 流畅 。 由 于 受 处 理 器 和 存储 器 的 限制 ,一 般 摄 像 机 帧 速 在 30 帧 /s。 缩 小 采集 
视 场 或 者 降低 分 辩 率 ,能 够 提高 帧 速 。 

(3 ) 分辩 率 

分 辩 率 是 影响 图 像 效果 的 重要 因素 ,一 般 用 水 平和 垂直 方向 上 所 能 显示 的 像素 数 来 表示 
分 辩 率 , 它 反映 了 摄像 机 分 解 和 重 现 细节 的 能 力 。 在 实际 应 用 中 ,摄像 机 、 检 测 系统 的 分 辩 率 
与 传 感 需 的 分 辩 率 不 同 。 摄 像 机 的 分 辩 率 除 传感器 的 分 辨 率 因 素 外 ,还 取决 于 镜头 、 传 感 器 的 
像素 尺寸 和 模拟 电路 。 分 辩 率 通常 以 每 毫米 多 少 线 对 (lp/mm) 表 示 。 如 果 传 感 器 像素 尺寸 为 
Pp, 理 论 上 最 大 空间 分 辨 率 为 1/(2p)lp/mm。 

(4) 线 阵 摄像 机 和 面 阵 摄像 机 

由 面 阵 传感器 构成 的 摄像 机 称 作 面 阵 摄 像 机 。 感 光 单 元 按 二 维 阵列 排列 ,阵列 中 的 每 个 
感光 单元 对 应 一 个 像素 ,被 拍摄 目标 的 一 面 被 成 像 ,目标 与 摄像 机 之 间 可 以 是 静止 的 ,也 可 以 
是 相对 运动 的 。 

还 有 一 类 传感器 ,感光 单元 排列 是 一 维 的 ,每 次 曝光 仅 是 目标 上 的 一 条 线 被 成 像 ,形成 一 
行 图 像 , 随 着 目标 与 摄像 机 之 间 的 相对 运动 ,摄像 机 连续 曝光 ,最 后 形成 一 幅 二 维 图 像 ,这 样 的 
摄像 机 叫 作 线 阵 摄像 机 。 为 保证 采集 到 的 图 像 不 变形 , 目标 相对 于 摄像 机 的 运动 应 保持 在 一 
个 方向 。 线 阵 摄像 机 每 一 行 扫描 的 像素 可 以 从 512 ~ 12000 ,每 行 的 曝光 也 可 以 与 目标 的 运动 
速度 无 关 , 因 此 线 阵 摄像 机 也 适用 于 目标 运动 速度 变化 的 场合 。 


2.4.3 智能 相机 


智能 相机 是 利用 光电 成 像 技 术 形 成 的 一 种 能 从 图 像 信号 中 实时 地 自动 识别 目标 、 提 取 目 
标的 特征 进而 根据 图 像 处 理 的 结果 来 控制 现场 设备 动作 的 嵌入 式 机 器 视觉 系统 。 

与 一 般 的 数字 相机 不 同 ,智能 相机 是 由 成 像 单 元 ,通信 单元 .图像 处 理 部 件 存储 部 件 等 构 
成 的 系统 。 虽 然 智能 相机 和 数码 相机 的 输入 都 是 CCD 或 CMOS 图 像 传感器 所 产生 的 图 像 信 
号 ,但 是 数字 相机 输出 的 是 一 幅 数 字 图 像 , 而 智能 相机 输出 的 是 对 数字 图 像 理解 和 分 析 的 结 
R ,并 不 仅仅 是 一 幅 数字 图 像 。 智 能 相机 中 的 图 像 处 理 算法 ,如 预 处 理 ,边缘 检测 、 中 值 滤波 ， 
为 后 续 处 理 服务 ,为 特征 提取 等 算法 做 准备 。 在 算法 实现 上 ,智能 相机 的 主要 准则 是 提高 “机 
de EAR" IURE" 的 能 力 , 其 目的 是 满足 运动 分 析 ` 工 业 生产 控制 、 质 量 控制 等 需要 ,减少 对 后 
续 图 像 处 理 系 统 的 依赖 ,提高 整个 系统 的 稳定 性 和 实时 性 。 

下 面 对 智 能 相机 的 结构 进行 详细 说 明 。 

1) 智 能 相机 系统 的 组 成 

智能 相机 系统 一 般 由 图 像 采 集 单元 、 图 像 处 理 单元 、 网 络 通信 单元 、 图 像 处 理 软件 四 大 部 
分 组 成 。 图 像 采 集 单元 图像 处 理 单元 、 网 络 通信 单元 等 又 可 细 分 为 光学 系统 、 成 像 系 统 .图像 
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预 处 理 系统 .通信 接口 .显示 接口 和 存储 系统 ,如 图 2-11 所 示 。 


通信 接口 


m 图像 预 处 理 系 统 


存储 系统 


图 2-11 智能 相机 组 成 框图 


图 像 传感器 是 智能 相机 系统 的 关键 部 分 , 它 负 责 完成 光电 信号 转换 ,输出 数字 图 像 供 后 端 
系统 处 理 。 新 型 的 固体 摄像 器 件 CMOS 图 像 传感器 逐渐 成 熟 ,其 具有 集成 度 高 、 开 发 简单 y 
耗 低 、 易 于 与 图 像 处 理 系统 连接 、 价 格 便宜 等 优点 ,在 智能 相机 中 得 到 了 广泛 应 用 。 通 信 接 口 
包括 各 种 常用 的 通信 控制 接口 ,如 RS232 .422 、. 千 兆 网 络 等 接口 。 存 储 系统 是 由 闪存 阵列 或 者 
磁盘 阵列 构成 ,用 于 实时 存储 传感器 输出 的 数字 图 像 , 供 事 后 进一步 分 析 处 理 。 

图 像 预 处 理 系统 负责 提取 数字 图 像 信 号 ,对 图 像 进行 实时 预 处 理 , 并 通过 通信 与 控制 模块 
实时 输出 处 理 结果 。 从 前 文 叙述 的 工作 机 理 可 以 看 出 ,图 像 预 处 理 系统 是 智能 相机 的 关键 部 
分 , 它 决定 了 整个 系统 的 功能 处 理 精度 和 速度 。 寻 找 快捷 、 高 效 的 图 像 处 理 方法 ,并 制作 出 相 
应 的 设备 是 人 们 一 直 在 努力 的 方向 。 显 示 接 口 包括 多 种 常用 的 接口 ,如 camera-link ,PAL-D， 
VGA , 千 兆 网 络 或 者 光纤 接口 等 ,用 于 提供 多 种 图 像 传输 和 显示 的 方式 。 

2) 智 能 相机 结构 及 原理 

(1) 图 像 采 集 单 元 

在 智能 相机 单元 中 ,图像 采集 单元 相当 于 普通 意义 上 的 CCD/CMOS 相机 和 图 像 采 集 卡 。 
它 将 图 像 转换 为 模拟 /数字 图 像 ,并 输出 至 图 像 处 理 单元 。 

(2) 图 像 处 理 单元 

图 像 处 理 单元 类 似 于 图 像 采 集 /处 理 卡 。 它 可 以 对 图 像 采 集 单元 的 图 像 数 据 进行 实时 的 
存储 ,并 在 图 像 处 理 软 件 的 支持 下 进行 图 像 处 理 。 

(3) 图 像 处 理 软件 

图 像 处 理 软件 主要 在 图 像 处 理 单元 硬件 环境 的 支持 下 ,完成 图 像 处 理 功能 。 如 几何 边缘 
的 提取 、Blob、 灰 度 直方 图 .OCV/OVR 、 简 单 的 定位 和 搜索 等 。 在 智能 相机 中 ,以 上 算法 都 被 封 
装 成 固定 的 模块 ,用 户 可 直接 应 用 而 无 须 编 程 , 也 可 根据 系统 需要 编写 相关 处 理 算 法 ,并 写 人 
智能 相机 中 。 

(4) 网 络 通信 单元 

网 络 通信 装置 是 智能 相机 的 重要 组 成 部 分 , 主要 完成 控制 信息 、 图 像 数 据 的 通信 任务 。 智 
能 相机 一 般 均 内 置 以 太 网 通信 装置 ,并 支持 多 种 标准 网 络 和 总 线 协 议 ,从 而 使 多 台 智 能 相机 构 
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成 更 大 的 机 器 视觉 系统 。 
2.4.4 ”相机 接口 


相机 将 拍摄 过 程 中 的 图 像 信息 存储 到 板 级 内 存 中 , 当 存 储 右 存 满 或 者 PC 发 出 读 命令 时 ， 
这 些 被 暂 存 的 数据 就 需要 通过 相机 接口 传递 给 后 端 设备 。 尽 管 板 上 高 速 大 容量 存储 何 的 引入 
使 得 相机 工作 速度 可 以 不 再 受 接口 带宽 的 限制 ,但 高 速 拍摄 、 高 速 存储 的 相机 配合 带宽 较 大 的 
传输 接口 才能 更 好 更 全 面 地 发 挥 其 高 速 性 能 。 

目前 CCD 及 CMOS 传感器 向 大 面 阵 、 高 帧 频 的 方向 发 展 ,数据 量 越 来 越 大 ,高 速 数据 传输 
技术 也 在 飞速 发 展 ,采用 CCD/CMOS 作为 传感器 相机 接口 就 利用 了 这 些 传输 技术 以 实现 大 量 
数据 的 传输 。 目 前 CCD/CMOS 相机 接口 主要 有 RS-644LVDS , USB , IEEE1394 , CameraLink 和 
GigE Vision, 

RS-422 接口 采用 低压 差分 信号 (Low Voltage Differential Signaling, LVDS ) 技术 ,利用 两 根 
平行 等 长 的 差分 线 传 输 信号 。 由 于 噪声 同时 作用 于 两 条 线 之 上 ,因此 接收 端的 减 操 作 可 以 在 
很 大 程度 上 消除 噪声 。 该 接口 抗 干 扰 能 力 强 , 信 号 传输 距离 远 ,最 高 可 达 1200m ,但 传输 速率 
慢 (10Mbit/s) 且 电缆 成 本 高 ,不 适合 应 用 在 高 速 场合 。 

USB 采用 4 针 接 口 ,连接 方便 ,支持 热 搬 拔 ,可 同时 连接 多 达 127 个 外 围 设 备 , 流行 的 
USB2. 0 数据 传输 率 最 高 可 达 480Mbit/s。 由 于 USB 总 线 协 议 是 主机 控制 的 协议 , 主 从 设备 之 
间 的 数据 传输 全 需 主 机 来 控制 , 且 传 输 距 离 只 有 Sm ,无 工业 标准 ,不 便 应 用 在 拍摄 某 些 危险 、 
高 速 流 逝 过 程 的 相机 中 。 

IEEE1394 又 称 “ 火线”( FireWire) ,最 早 由 苹果 公司 开发 用 于 计算 机 网 络 互联 ,采取 点 对 
点 通信 方式 ,无 须 电 脑 控制 数据 的 传输 过 程 。1394a 最 高 以 400Mbit/s 的 速度 传输 ,最 大 传输 
距离 为 10m;1394b 最 大 传输 速度 为 800Mbit/s ,传输 距离 为 4.5m。1394 与 USB 接口 一 样 都 支 
持 热 插 拔 , 目 前 在 连接 数码 相机 扫描“ 仪 和 信息 家 电 等 方面 都 有 应 用 。 然 而 ,其 带宽 在 高 分 辩 
A .高速 CMOS 相机 中 仍 略 显 不 足 且 线 缆 长 度 受 限 ,开发 成 本 较 高 。 

CameraLink 是 基于 Channel Link 技术 发 展 而 来 的 一 种 通信 接口 。 其 中 Channel Link 将 28 
路 单 端 数 据 信号 和 1 路 单 端 时 钟 信号 并 / 串 转换 成 4 对 差分 数据 信号 和 1 对 差分 时 钟 信号 , 利 
用 5 对 双 绞 线 传输 28bit 数据 ,在 85MHz 时 钟 下 可 以 达到 2. 38Gbit/s 的 数据 传输 率 , 最 长 传输 距 
离 可 达 13m。 除 了 图 像 数 据 之 外 ,Camera Link 还 提供 了 用 于 控制 以 及 双向 串 行 通信 的 接口 连 
接 ,方便 两 端的 设备 发 送 和 接收 来 自 对 方 的 控制 信号 。 男 有 Base Medium 和 Full 三 种 配置 方式 ， 
全 面 应 对 各 种 数据 传输 场合 。Camera Link 以 其 高 速率 、 低 噪声 的 传输 特点 受到 了 各 工业 级 相机 
生产 厂商 的 青睐 ,其 协议 具有 开放 性 和 通用 性 ,为 数字 相机 和 图 像 采 集 卡 之 间 的 接口 制定 了 标 
准 和 规范 ,方便 用 户 采用 统一 的 物理 接 插件 和 线 缆 定 义 进行 连接 , 极 大 地 提高 了 相机 兼容 性 。 

GigE Vision 是 由 自动 化 影像 协会 ( Automated Imaging Association , ATA ) 发 起 制定 的 一 种 基 
于 计算 机 网 络 帧 传输 的 接口 标准 ,是 建立 在 千 兆 以 太 网 技术 之 上 的 一 种 新 标准 。GigE 接口 拥 
有 1000Mbit/s 的 传输 速率 ,最 大 传输 距离 可 达 100m , 正 逐 步 发 展 成 为 数字 图 像 接口 领域 的 主 
导 力 量 。 然 而 ,基于 包 交 换 的 以 太 网 协议 在 数据 收发 过 程 中 需要 不 断 地 向 CPU 发 起 中 断 , 海 
量 数 据 的 传输 会 极 大 地 增加 主机 负担 ,甚至 造成 丢 包 、 延 迟 等 现象 。 

由 上 述 分 析 可 知 ,传统 串 行 接口 在 接口 速度 传输 距离 等 方面 能 够 满足 大 多 数 应 用 场合 的 
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需求 ,是 中 低 端 市 场 的 主力 ,比如 普通 工业 相机 多 采用 USB 或 者 IEEE1394 接口 ,简单 易 用 ,性 
价 比 高 。 而 Camera Link 和 GigE Vision 由 于 开发 成 本 较 高 ,一 般 只 用 在 少数 高 端 场合 。 由 于 
机 器 视觉 系统 中 相机 输出 的 数据 量 较 大 ,对 接口 提出 了 较 高 要 求 。 考 虑 到 Camera Link 接口 采 
用 并 行 传输 速度 更 快 ,LVDS 双 绞 线 电 缆 增 强 了 接口 的 抗 干扰 能 力 , 且 硬 件 上 只 需 三 块 芯片 ， 
便于 控制 ;而 GigE 虽然 速度 快 ,传输 距离 远 ,但 基于 网 络 帧 的 传输 需要 涉及 数据 链 路 层 的 各 种 
复杂 操作 以 及 千 兆 以 太 网 的 驱动 设计 ,增加 了 系统 设计 难度 ,因而 实际 中 常 选 用 Camera Link 
作为 相机 接口 ,实现 内 存 数据 的 快速 、 低 噪声 传输 。 


2.5 图 像 采 集 技 术 


在 机 融 视 觉 中 ,图像 采集 卡 的 作用 就 是 将 相机 输出 的 图 像 数 据 进行 高 速 采集 ,并 提供 给 
PC 的 高 速 接口 。 机 央 视 觉 系 统 的 图 像 采 集 卡 必须 能 够 实时 完成 对 高 速 的 大量 的 图 像 数据 的 
处 理 , 而 且 还 要 和 相机 协调 工作 ,才能 够 完成 特定 的 图 像 采 集 工作 ;能 够 接收 来 自 数码 相机 的 
高 速 数 据 流 , 并 通过 PC 总 线 输入 至 存储 器 中 。 此 外 , 由 于 相机 为 了 提高 数据 传送 能 力 , 大 多 
具有 多 个 输出 通道 ,使 多 位 像素 并 行 输出 。 这 时 ,机 需 视 觉 系统 的 图 像 采 集 卡 就 必须 具有 能 够 
对 多 路 输出 数据 进行 重组 ,还 原 图 像 的 功能 。 

2.5.1 数据 采集 的 基本 理论 

数据 采集 是 指 将 模拟 量 数据 经 过 采样 .量化 、 编 码 \ 存 储 的 过 程 (图 2-12) 。 相 应 的 系统 就 
是 数据 采集 系统 。 系 统 将 各 种 要 处 理 的 模拟 量 数据 转化 为 数字 量 的 数据 ,便于 后 续 的 处 理 
操作 。 

X(t) 


X() 





X, (nT,) 
X, (nT,) 
X, (1T,) 
X, QT) X(n) 
X(n) 





| 
| 
0 100 011 010 010 7 
图 2-12 数据 采集 过 程 
下 面 主要 就 采样 和 量化 过 程 进行 详细 说 明 。 
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1 ) 采 样 

采样 是 采样 系统 的 第 一 步 也 是 最 关键 的 一 步 , 只 有 选择 合适 的 采样 频率 和 采样 器 件 , 才 能 
保证 采样 得 到 的 信号 不 失真 地 反映 采样 前 的 信号 。 根 据 采 样 定理 ,对 一 个 具有 有 限 频谱 XX(/) 
的 连续 信号 X (C) 进行 采样 , 当 采 样 频 率 f 宇 2f,,,(f,,. 为 信号 的 最 高 频率 ) 时 ,由 采样 得 到 的 采 
样 信号 X.(n7s) 能 够 不 失真 地 恢复 原来 的 信号 XL) 。 

2) 量 化 

量化 的 过 程 实质 上 就 是 将 采样 后 离散 的 数据 同 量化 单位 进行 比较 的 过 程 。 量 化 单位 q 定 
义 为 : 

q = FSR/(2n) 
IUP : FSR——H ES W fE EJE (Full Scale Range) ; 
n HEB SER n 的 位 数 越 多 ,量化 单位 就 越 小 ,量化 的 精度 也 就 越 高 。 
实际 使 用 中 gq 取 9.96, 常 用 的 量化 方法 主要 有 “只 舍 不 人 "量化 法 和 “有 舍 有 入 ”量化 法 。 
(1)“ 只 侈 不 人 ”量化 法 
“只 舍 不 人 "量化 法 是 指 在 量化 后 的 信号 幅度 小 于 量化 单位 时 一 律 舍 去 。 例 如 ,如 果 量 化 
单位 为 0.01V, 而 量化 前 幅 值 为 6V, 则 量化 后 幅 值 只 取 9.96V。 

(2)“ 有 舍 有 入 ”量化 法 

“有 人 铭 有 入 ”量化 法 是 指 在 量化 后 的 信号 幅度 小 于 0.5 倍 的 量化 单位 (0. 5q) 时 舍 去 ,在 大 
于 0.5 倍 的 量化 单位 (0. 5g) 时 进 一 位 。 例 如 ,如 果 量 化 单位 为 0. 01V ,而 量化 前 的 幅 值 为 
9. 966V , 则 量化 后 幅 值 为 9.97V。 

在 实际 电路 中 ,量化 和 编码 大 多 是 同时 进行 的 。 经 过 采样 .量化 和 编码 处 理 , 将 原 有 的 模 
拟 量 信息 转化 为 数字 量 ,再 交 由 处 理 右 处 理 或 者 存储 。 


2.5.2 图 像 采集 卡 的 结构 及 原理 


虽然 图 像 采集 卡 的 种 类 特性 各 不 相同 ,但 是 内 部 结构 都 大 致 相同 ,图 2-13 中 展示 的 是 一 
般 图 像 采 集 卡 的 结构 。 下 面 就 图 像 采 集 卡 的 各 个 级 (模块 ) 进 行 介绍 。 

(1) 视 频 输入 级 

视频 输入 级 直接 和 相机 相连 。 由 于 多 数 相 机 为 了 提高 传输 数据 的 速率 ,一 般 会 同时 并 行 输 
出 多 位 数据 。 因 此 ,图 像 采 集 卡 的 视频 输入 级 大 多 内 置 了 多 路 分 配器 来 满足 这 一 要 求 。 此 外 ,为 
了 避免 信号 中 的 彩色 部 分 产生 干扰 图 案 , 提 高 对 图 像 的 采集 和 更 有 利于 对 图 像 的 分 解 , 一 般 还 必 
须 在 视频 输入 级 中 包含 色彩 滤波 器 。 经 过 视频 输入 级 后 ,图 像 信号 进入 A/D 转换 级 。 

(2) AZD 转换 级 

在 图 像 采集 卡 中 ,AZD 转换 级 是 最 关键 的 一 级 。 因 为 A/D 转换 级 将 输入 的 模拟 图 像 信 号 
转换 为 计算 机 可 识别 的 数字 图 像 信号 ,而 且 这 一 转换 必须 是 实时 的 ,因此 图 像 采 集 卡 的 性 能 和 
A/D 转换 级 的 速率 直接 相关 。 此 外 ,AZD 转换 级 还 必须 和 时 序 同步 采集 控制 逻辑 电路 密切 配 
合 , 才 能 使 图 像 采 集 卡 完成 对 图 像 的 输入 和 转换 。 

(3) 时 序 、 同 步 采集 控制 级 

在 图 像 采 集 卡 中 ,时 序 、 同 步 逻 辑 控制 级 就 是 时 序 、 同 步 软 辑 控 制 电路 。 时 序 电 路 用 于 以 
固定 频率 (适用 于 标准 视频 格式 ) 或 可 变频 率 ( 非 标准 视频 格式 ) 的 操作 。 其 中 时 序 电路 直接 
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和 图 像 采 集 卡 的 同步 电路 相连 ,目的 是 使 图 像 采 集 卡 的 时 序 电路 和 输入 图 像 信号 同步 。 同 步 
电路 采用 了 模拟 锁 相 环 ( PLL) 电 路 或 数字 时 钟 同步 (DCS) 电 路 。 


PCI 总 线 接口 
总 线 控制 器 





图 2-13 图像 采 集 卡 的 结构 


此 外 ,为 了 抑制 噪声 和 防止 低 质量 的 视频 信号 对 同步 脉冲 时 序 信 号 的 干扰 ,图 像 采 集 卡 一 
般 还 具有 附加 的 同步 电路 。 

(4) 图 像 处 理 级 

在 图 像 处 理 级 ,利用 经 过 A/D 转换 的 数字 信号 对 图 像 进行 处 理 。 其 中 ,相对 于 使 用 主机 
软件 的 方法 来 实时 转换 数据 图 像 ,或 者 对 图 像 的 灰 度 进行 转换 ,利用 图 像 处 理 级 的 输入 查找 表 
速度 更 快 。 而 调 色 匹 配 查找 表 多 用 于 黑白 图 像 采 集 卡 ,用 来 控制 主机 的 彩色 调 色 板 ,避免 软件 
应 用 中 的 黑白 图 像 失真 。 

此 外 ,还 有 缩放 比例 裁剪 电路 ,用 来 对 数字 图 像 在 xy 方向 进行 裁剪 。 裁 前 过 后 要 传输 的 
图 像 又 称 " 兴 趣 图 像 ”, 剩 余 的 部 分 则 被 抛弃 。 由 于 裁剪 后 图 像 的 尺寸 变 小 了 ,从 而 能 够 更 快 
地 传输 ,也 能 加 快 图 像 的 处 理 速 率 。 

(5) PCI 总 线 接口 及 控制 级 

对 于 机 器 视觉 系统 , PCI 总 线 主要 用 来 传输 图 像 数 据 ,因此 PCI 总 线 必须 保证 一 定 的 
带宽 。 

(6) 相 机 控制 级 

相机 控制 级 主要 用 来 提供 相机 的 设置 及 控制 信号 ,例如 相机 的 水 平 /垂直 同步 信号 ,像素 
及 复位 信号 等 。 

(7) 数 字 输 入 /输出 级 

数字 输入 /输出 级 能 够 使 图 像 采 集 卡 通过 TIL 信号 与 外 部 装置 进行 通信 ,能 够 用 来 控制 
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和 响应 外 部 事件 。 
2.5.3 ”图 像 采集 卡 的 性 能 指标 


(1 ) 分 辩 率 

采集 卡 能 支持 的 最 大 点 阵 反 映 了 其 分 辩 率 的 性 能 , 即 所 能 支持 的 相机 的 最 大 分 辨 率 。 但 
分 辩 率 并 不 是 越 高 越 好 ,分 辩 率 越 高 ,采样 后 图 像 的 像 元 数 就 越 多 ,对 CPU 和 内 存 的 要 求 也 
越 高 。 

(2) 传输 通道 数 

当 摄像 机 以 较 高 速率 拍摄 高 分 辩 率 图 像 时 ,会 产生 很 高 的 输出 速率 ,这 一 般 需 要 多 路 信和 号 
同时 输出 ,图像 采集 卡 应 能 支持 多 路 输入 。 一 般 情 况 下 ,有 1 路 2 路 4 路 8 路 输入 等 。 

(3) 采 样 频率 

采样 频率 反映 了 采集 卡 处 理 图 像 的 速度 和 能 力 。 在 进行 高 速 图 像 采 集 时 ,需要 注意 采集 
卡 的 采样 频率 是 否 满足 要 求 。 

(4) 图 像 输 入 格式 

图 像 采集 卡 所 支持 的 图 像 格式 是 图 像 采 集 卡 的 重要 参数 之 一 。 大 多 数 摄像 机 采用 RS422 
或 EIA644 作为 输出 信号 格式 。 这 样 ,图 像 采 集 卡 就 必须 支持 系统 所 使 用 相机 的 输出 信号 
格式 。 


2.6 摄像 机 标定 技术 


在 机 器 视觉 系统 中 ,从 摄像 机 得 到 的 图 像 信 息 出 发 ,计算 出 三 维 环境 中 物体 的 位 置 .形状 
等 几何 信息 ,并 由 此 重建 三 维 物体 。 这 些 物 体位 置 的 相互 关系 由 摄像 机 成 像 几 何 模型 所 决定 。 
该 几何 模型 的 参数 称 为 摄像 机 参数 ,这 些 参数 必须 由 试验 与 计算 确定 ,这 个 过 程 就 称 为 摄像 机 
标定 。 

2.6.1 成 像 儿 何 模型 


为 了 定量 地 描述 摄像 机 成 像 过 程 ,首先 定义 图 像 坐标 系 、 成 像 平面 坐标 系 、 摄 像 机 坐标 系 
和 世界 坐标 系 四 个 参考 坐标 系统 ,以 便于 更 好 地 描述 成 像 模型 。 

1) 坐标 系 

(1) 图 像 坐 标 系 

摄像 机 采集 的 数字 图 像 在 计算 机 内 可 以 存储 为 数组 ,数组 中 每 个 元 素 的 值 就 是 该 点 的 亮 
度 (或 称 为 灰 度 , 若 为 彩色 图 像 , 则 图 像 的 像素 亮度 将 由 红 绿 蓝 三 种 颜色 的 亮度 表示 ) 。 假 设 
数字 图 像 在 计算 机 内 为 一 个 M x 的 数组 ,在 图 像 上 定义 直角 坐标 系 u,v。 每 一 个 像素 的 坐 
标 (u,v) 表 示 该 像素 在 数组 中 的 列 数 与 行 数 。 由 于 (u,v) 只 表示 像素 位 于 的 列 数 与 行 数 , 并 没 
有 用 物理 量 纲 表示 出 该 像素 的 位 置 ,因此 需要 再 建立 以 物理 单位 表示 的 图 像 坐标 系 。 该 坐标 
系 以 图 像 内 的 某 一 点 0 为 原点 ,X 轴 与 Y 轴 分 别 与 ,v 轴 平 行 ,如 图 2-14 所 示 。 

在 X-Y 坐标 系 中 ,原点 0, 定义 在 摄像 机 光 轴 与 图 像 平面 的 交点 ,该 点 一 般 在 图 像 的 中 心 。 
若 O, TE u-v 坐标 系 中 的 坐标 为 (uw, vs) ,X 轴 与 Y 轴 方向 上 的 像素 间距 为 d, ,d, ,那么 图 像 上 任 
意 一 点 在 两 个 坐标 系 中 有 如 下 关系 : 
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X/d, + uo (2-1) 
v = Y/d, + vo 
为 了 使 用 方便 ,我 们 用 齐 次 坐标 与 矩阵 的 形式 将 上 式 表示 为 : 
u 1/d, 0 Uo X 
v | "| 0 d t | (2-2) 
1 0 0 p Ji 
Oo Oo 
ee Oi 
d, 
v 4 y" } 
a) b) 


图 2-14 ”图像 坐 标 系 
(2) 摄 像 机 坐标 系 
摄像 机 成 像 几 何 关系 可 由 图 2-15 表示 ,其 中 0, 点 称 为 摄像 机 光 心 ,X, IURI Y, 轴 与 成 像 
平面 坐标 系 的 x 轴 和 y 轴 平 行 ,Z, 轴 为 摄像 机 的 光 轴 ,与 图 像 平面 垂直 。 光 轴 与 图 像 平面 的 


交点 为 图 像 中 心 点 01 ,由 0, 点 与 X,Y Z, 轴 组 成 的 直角 坐标 系 称 为 摄像 机 坐标 系 。0.0， 
为 摄像 机 焦距 (7) 。 











图 2-15 ”摄像 机 坐标 系 


(3) 世 界 坐 标 系 
为 了 表示 摄像 机 在 空间 的 位 置 ,还 需要 引入 世界 坐标 系 。 摄 像 机 坐标 系 和 世界 坐标 系 之 
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间 的 关系 可 用 旋转 矩阵 与 平移 向 量 T 来 描述 。 由 此 ,空间 中 一 点 P 了 在 世界 坐标 系 和 摄像 机 
坐标 系 下 的 齐 次 坐标 分 别 为 (X,Y, ,2Z, ,1)" 与 (X,Y.,Z.,1)" ,它们 之 间 存 在 如 下 关系 : 


X, X. X, 
Y | rR TY, Y, 

-| | -M (2-3) 
zi te 1Jz Z, 


1 1 1 


其 中 ,R 是 3 x3 的 正 交 单 位 矩阵 ,T = (4 ,t, ,ts)" 是 三 维 平移 向 量 ,0 2 (0,0,0) , M 是 两 
个 坐标 系 之 间 的 联系 矩阵 ,也 叫 外 参数 矩阵 。 

2) 摄像 机 成 像 模型 

(1) 线 性 模型 

线性 模型 又 称 为 针 孔 成 像 模型 ,空间 任意 一 点 尸 在 图 像 中 的 成 像 位 置 可 用 针 孔 模型 近似 
表示 , 即 任何 一 点 己 在 图 像 上 的 投影 位 置 p 为 光 心 0. 同 P 点 的 连 线 O.P 这 种 关系 也 称 为 中 
心 投影 或 透视 投影 ,如 图 2-16 所 示 。 


虚拟 成 像 平 面 





比例 关系 如 下 : 


(2-4) 


X, 








X, 
[000 
Y, 
Jr Pw 1 (2-5) 
0 0 1 i 
1 
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将 式 (2 了 2) 与 式 (2-3) 带 入 式 (2-5) ,就 得 到 由 世界 坐标 系 表示 的 P 点 坐标 与 投影 点 p 点 坐 
标 ( u,v) 的 关系 : 


1 w 
1 
^ X. X x 
a 
wi 0 0 oy l 0 0T | Y 
=|0 a, mwlo 1 2 44 d IP (2-6) 
5 0 1J49 0 1 0 * 0 1 0 " " 
l 1 1 


式 中 ;A 一 一 比例 因子 ; 

天 一 一 摄像 机 的 内 部 参数 矩阵; 

也 一 一 摄像 机 的 外 部 参数 矩阵 ; 

忆 一 一 投影 矩阵 a, - f/4, 7M u 轴 上 尺度 因子 ,或 称 为 wu 轴 上 归 一 化 焦距 ; 

a 一 一 v 轴 上 尺度 因子 ,或 称 为 v 轴 上 归 一 化 焦距 ,a, =f/d,; 
(uo ,vo ) 主 点 坐标 。 

由 于 a, ,a, us oy 只 与 摄像 机 内 部 结构 有 关 , 故 称 为 摄像 机 内 部 参数 ,R 和 1 由 摄像 机 相对 
于 世界 坐标 系 的 方位 决定 , 称 为 摄像 机 外 部 参数 。 














a, 0 ug 
ERREDURA I K £472 ,K-2|0 a, v |。 为 了 增加 一 般 性 ,可 以 考虑 含有 
0. 0. 1 
TA SR BI. 
Qq, S. "s 
K - I G, Vy (2-7) 
0 1 
(2) 非 线性 模型 


由 于 摄像 机 光学 系统 在 实际 加 工 制作 时 存在 误差 ,并 不 是 理想 的 针 孔 成 像 模 型 ,因而 其 物 
与 像 并 非 完 全 满足 相似 三 角形 关系 ,存在 畸变 。 物 点 与 摄像 机 像 面 上 实际 所 成 的 像 与 理想 成 
像 之 间 主 要 存在 径 向 畸变 和 切 向 畸变 两 种 光学 畸变 误差 。 其 中 径 向 畸变 关于 摄像 机 镜头 的 主 
光 轴 对 称 而 切 向 畸变 则 不 关于 摄像 机 镜头 的 主 光 轴 对 称 。 昌 然 实际 上 还 存在 ,如 不 对 称 像 差 、 
薄 透 镜像 差 等 问题 ,但 考虑 过 多 的 畸变 参数 不 仅 不 能 提高 标定 精度 ,反而 会 使 标定 结果 不 稳 
定 。 因 此 在 这 里 ,主要 考虑 镜头 径 向 畸变 和 切 向 畸变 。 

设 理想 成 像 点 的 物理 坐标 为 (x, ,y, ) ,畸变 后 的 物理 坐标 为 (xv,yv ) ,理想 成 像 点 的 物理 坐 

br (x, y, ) 与 对 应 的 世界 坐标 点 有 如 下 关系 : 
Ti I; 
tite tho I; (2-8) 
o T3 NS Tg. b jt 


rst +t ry + T, 
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可 建立 如 下 总 像 差 模型 . 
Slan) -9 x, * (kp) Fp ) Fh (332 e 3) «2k, x, y, (2-9) 
8 (xy) 9 y,* (p^ p) «2k «x, y, t E, * (n, F 
其 中 ,po = Vx + ,hi ,ho 为 径 向 畸变 系数 ,h ,ho 为 切 向 畸变 系数 。 由 理想 物理 坐标 到 实 
际 物理 坐标 的 关系 如 下 ; 
= (2-10) 
y, = tO ie. o y) 
由 实际 物理 坐标 到 实际 像 点 (4,v) 的 关系 为 
[ 2f tC, 
vzfyi-C, 
综合 式 (2-9) ~ 式 (2-11) 即 得 到 如 下 成 像 模 型 ; 
- fx, tf), *C, 
sep. RESBG.X) t C 
RP a, Yu (x, y.) 0, (x, y, ) PTUS (2-8) X (2-9) BE 
2.6.2 ”典型 标定 方法 
基于 三 维 标定 物 的 传统 摄像 机 标定 方法 采用 了 摄影 测量 学 中 的 技术 ,该 技术 在 标定 时 , 需 
要 一 个 标定 参照 物 ,摄像 机 获取 标定 物 的 图 像 后 ,通过 复杂 的 数学 计算 即 可 得 到 摄像 机 的 内 外 
参数 。 传 统 的 摄像 机 标定 方法 有 很 多 ,本 节 主 要 介绍 经 典 的 直接 线性 变换 方法 .Tsai 的 两 步 标 
定 法 以 及 Zhang 的 平面 标定 法 。 
1 ) 直接 线性 变换 方法 
直接 线性 变换 方法 于 1971 年 由 Abdel - Aziz 和 Karara 首先 提出 。 这 种 方法 通过 解 线性 方 
程 就 可 以 求 得 摄像 机 的 参数 。 但 是 ,这 种 方法 的 局 限 是 完全 没有 考虑 摄像 机 成 像 过 程 中 的 非 
线性 畸变 。 因 而 ,为 了 提高 标定 的 精度 ,必须 针对 非 线性 部 分 设计 优化 算法 。 
直接 线性 变换 方法 的 模型 是 : 
Xalo + ywzo + Zulo + Los 


- 2-13 
Xho + yl + zd + Ls i ) 


(2-11) 


(2-12) 





TE Xulio yul zh + hs (2-14) 
Xalo + Yela tz Io + D, 

其 中 ,，(x, ,yw ,zw ) 是 标定 参照 物 上 特征 点 的 三 维 坐 标 , (u,v) 是 该 特征 点 在 图 像 坐标 系 中 
的 坐标 ,1; 是 直接 线性 变换 方法 的 待定 参数 。 不 失 一 般 性 ,可 以 令 ;=1。 如 果 知 道 标 定 参 照 
物 上 N(N >5) 个 特征 点 的 坐标 (x, ,y, uz, ) 及 其 对 应 的 图 像 点 坐标 (u,v) ,11 个 参数 就 可 以 通 
过 线性 最 小 二 乘 方 法 计算 。 当 不 考虑 摄像 机 成 像 过 程 中 镜头 的 非 线 性 畸变 时 ,直接 线性 变换 
方法 即 下 面 将 要 介绍 的 利用 透视 变换 矩阵 的 摄像 机 标定 方法 。 而 考虑 非 线 性 畸变 时 ,直线 变 

换 方法 中 图 像 点 与 三 维 标定 物 上 特征 点 的 对 应 关系 为 : 
Xwiloo + Ywiloi + ql + los 
uilo + yw + Zula + bs 





u; + Au, (u; ,v;) O 


(2-15) 
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wuilio + Yul + Zuil + hs 
Xwi12o + yl + Zuil + Lb. 

其 中 ,(x, ,yi ,zw ) 是 标定 参照 物 上 第 i 个 特征 点 的 坐标 , (uw ,wi) 是 标定 参照 物 上 特征 点 
对 应 的 实际 图 像 坐标 。 图 像 点 的 坐标 可 以 通过 数字 图 像 处 理 技 术 获 得 。( wi,v;) 是 校正 后 的 
图 像 点 坐标 ,Au,(u,v) 和 Av,(w,,v,) 是 在 图 像 点 (u,v) 处 的 镜头 畸变 矫正 。 因 此 可 以 看 出 ， 
在 直接 线性 变换 中 加 入 畸变 因素 是 比较 方便 的 。 

2) Tsai 的 两 步 标定 法 

Tsai 在 1986 年 首次 提出 基于 径 向 约束 的 两 步 法 (two-stage) 标定 方法 ,该 方法 首先 利用 最 
小 二 乘法 解 线性 方程 ,给 出 外 部 参数 ,然后 求解 内 部 参数 ,如 果 摄 像 机 无 镜头 畸变 ,可 由 一 个 超 
定 线性 方程 解 出 ,如果 存 在 径 向 畸变 , 则 可 结合 非 线 性 优化 方法 获得 全 部 参数 。 该 方法 计算 适 
中 ,精确 度 较 高 。 

在 图 2-17 中 , 设 P(x, sy, ,z, ) 是 世界 坐标 系 中 物体 点 P 的 三 维 世 界 坐 标 ,P(x ,y, ,z, ) 是 该 点 
在 摄像 机 坐标 系 中 的 坐标 ,0,-xy 是 成 像 平 面 坐标 系 P, (x, ,y, ) 理想 的 图 像 点 P(x ,y, ) 畸变 后 
的 实际 图 像 点 。 假 设 摄像 机 镜头 畸变 是 径 向 的 ,无 论 畸 变 如 何 变化 ,0 , P, (x,,y,) 和 P,(x,,y,) 
三 点 始终 在 一 条 直线 上 ,焦距 f 的 变化 只 会 影响 它 的 长 度 而 不 会 影响 它 的 方向 ,图 像 中 心 0, 到 
P (x,y AE L, 始终 与 P,(x,,y,) 和 P(xs,ya) 三 点 始终 在 一 条 直线 上 ,焦距 /的 变化 只 会 
影响 万 的 长 度 而 不 会 影响 它 的 方向 ,图 像 中 心 O, 到 P, Cx, ,y, ) E L 始终 与 P,(0,0,2,) 到 
P(X,,Y,,Z, ) 的 向 量 厂 平行。 这 就 是 Tsai 两 步 法 中 最 重要 的 径 向 排列 约束 ( RAC) 。 


v; + Av, (u;,v;) up 


(2-16) 







1 
Pi (xa ya) 


P,: (0, 0, Z) 


P(X» Y, Z) 


Kd 2-17 ”坐标 变换 
从 世界 坐标 (XX,,Y, ,Z, ) 到 像素 坐标 (wz) 的 变换 过 程 可 以 分 为 如 下 四 步 ; 
(1) 由 式 (2-3) 可 知 ,世界 坐标 系 和 摄像 机 坐标 系 的 关系 为 : 
X, = RX, *t (2-17) 
(2) 针 和 孔 模 型 下 摄像 机 坐标 系 与 成 像 平 面 坐标 系 的 关系 为 : 
A): 
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X Y 
a e VS ofa (2-18) 
(3 ) 考 虑 镜头 畸变 的 影响 。 因 为 径 向 畸变 是 影响 工业 机 器 视觉 精度 的 主要 因素 ,所 以 ,只 
考虑 径 向 畸变 ,用 一 个 二 阶 多 项 式 近似 表示 ; 








x manti) (2-19) 
y, = ya(1 + kri) (2-20) 
(4) 成 像 平面 坐标 系 到 计算 机 图 像 坐 标 系 的 变换 为 ; 
XQ 
SP do uo Ce 
T Ja 
i= d vg (2-22) 


利用 径 向 排列 约束 (RAC ) 求 取 摄像 机 参数 的 过 程 主要 分 为 如 下 两 步 : 
第 一 步 ;求解 旋转 矩阵 及 ,平移 向 量 ! 的 上 t, 分 量 。 
由 RAC 条 件 可 得 : 
Wu) = Ts 
Y, E Ya ~ (v - v )d, hA, Y, oat. +i, 12283 
不 失 一 般 性 ,可 利用 共 面 点 进行 标定 ,将 上 式 移 项 ,整理 可 得 ; 
| rib, 


LX yas Y aSa Sus Aus — Y s] t/t, = Xy (2-24) 





Lrt, 

拍摄 一 幅 含 有 若干 个 共 面 特征 点 的 图 像 , 需 确定 N 个 特征 点 的 图 像 坐 标 , 当 N >5 时 ,可 
用 最 小 二 乘法 求解 这 个 超 定 方程 组 ,得 到 如 下 变量 : 

pecho qos urhe ure Se (225) 
t E b 3 5 

IA PEXR UE RA 9 个 参数 ,但 因为 它 是 单位 正 交 符 阵 ,所 以 仅 有 3 个 独立 变量 。 利 用 R 
的 正 交 性 可 以 计算 出 旋转 矩阵 和 平移 向 量 1 的 1,,t, 分 量 。 

第 二 步 . 求 解 有 效 焦距 f, 平 移 向 量 1 的 i ,i, 分 量 和 透镜 畸变 系数 


对 每 个 特征 点 P, 有 下 面 等 式 成 立 : 


篇 mg tr Yu + t, (2-26) 
Za = TX pi + rey +t, 
4 w =r Xu +r Y, S IRA a , BIBU k -0, I. 
Yu Ya Y; 
PER (M 227 
adco EN 
由 于 Z, 2 W, + 上 , 则 上 式 可 展开 为 : 
LI. -4,0 -x)1[ ] 24,6 - n) (228) 
t 


mesi ue 
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因为 R FU c, 均 已 知 ,所 以 了 ,很 容易 求 得 , 解 此 超 定 方程 组 可 得 有 效 焦距 /和 平移 向 量 t 的 i, 分 
量 。 再 考虑 径 向 畸变 ,用 这 些 值 作为 初始 值 ,利用 非 线 性 优化 算法 即 可 求解 出 ,1.,k 的 精确 值 。 
3) Zhang 的 平面 标定 法 
1998 年 Zhang ZY 针对 径 向 畸变 ,提出 了 一 种 利用 多 幅 平面 模板 求解 摄像 机 内 外 参数 的 
方法 。 该 方法 需要 摄像 机 从 不 同 的 角度 拍摄 平面 模板 的 多 幅 图 像 ( 至 少 3 幅 ) ,通过 平面 模板 
上 每 个 特征 点 与 其 图 像 上 像 点 之 间 的 对 应 关系 , 即 每 幅 图 像 的 单 应 性 矩阵 来 约束 摄像 机 的 内 
部 参数 。 该 方法 也 是 基于 两 步 法 的 思想 , 即 先 线性 求解 出 部 分 参数 的 初始 值 , 然 后 考虑 径 向 畸 
变 并 用 最 大 似 然 准 则 对 计算 结果 进行 非 线性 优化 ,最 后 利用 内 参数 矩阵 和 单 应 性 矩阵 求 出 外 
部 参数 。 具 体 算法 如 下 : 
(1) 设 平面 模版 上 三 维 空间 点 M = (X,Y., ,2,)", 二 维 图 像 点 m = (u,v)", 相 应 的 齐 次 坐 
标 分 别 为 M = (X,Y,Z,,1)" 和 m = (u,v,1)", 由 摄像 机 针 孔 成 像 模型 可 得 
Am = K(R 1M (2-29) 
式 中 ;A 一 一 比例 因子 ，; 
[R 局 一 一 外 部 参数 矩阵 ; 
天 一 一 内 部 参数 矩阵 。 
(2) 因为 是 利用 平面 模板 进行 标定 ,所 以 可 令 模板 平面 的 Z 坐标 为 零 。 将 旋转 矩阵 R 表 
示 为 R=[r，r，7], 则 上 式 可 表示 为 : 


X. 

u y 

Alu (= Kin ta Ta l| "=K ty t] y. 
0 

1 


(2-30) 











1 
其 中 , 石 为 一 个 3 x3 的 单 应 性 矩阵。 五 可 表示 为 : 
H=[h h, hj]zyK[n n t] (2-31) 
其 中 勾 为 比例 因子 。 给 定 模板 平面 及 其 图 像 ,可 以 计算 出 它们 之 间 的 单 应 性 矩阵 H, A 
为 R 是 单位 正 交 和 矩阵 ,所 以 7, ,r, WIE: 


T 
rn -0 


(2-32) 
ln ll = lr,l 21 
H3X (2-32) 可 得 ， 
1 天 KKj = 0 (2-33) 
hK K h, = h, K'K`'h, (2-34) 


AREFE e H RRIA BROER 
(3) 令 C=K-'K-', 则 C 表示 的 是 一 个 绝对 二 次 曲线 在 图 像 上 的 像 。 绝 对 二 次 曲线 的 像 
包含 了 摄像 机 内 参数 的 所 有 信息 ,如 果 能 求解 出 C 则 可 以 轻松 地 计算 出 摄像 机 内 参数 和 矩阵。 
注意 C 是 一 个 对 称 和 矩阵 ,可 以 表示 成 下 面 的 一 个 六 维 向 量 : 
C = [cn ca C2 Ca C3 63]. (2-35) 
SHERE H BUS LP, m [ha ha ha] , 则 式 (2-35) 可 以 表示 为 : 
zx 49. 
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h;Ch, = VC 
其 中 v=[hahs hahp+hohy hah, haha thahs hah, +hohs hahgl"o 
利用 约 条 件 可 以 得 方程 组 
Vi 
Ly E? (2-36) 
WRA 幅 模板 平面 的 图 像 , 则 可 以 得 到 ; 
Vc 20 


其 中 ,V d 2n x6 的 和 矩阵, 如果 n=3, 则 c 可 以 在 相差 一 个 尺度 因子 的 意义 下 唯一 确定 。 
求解 出 ec 之 后 ,可 以 利用 Cholesky 矩阵 分 解 算法 求解 出 K” ,此 时 就 可 以 比较 方便 地 得 到 5 个 
内 参数 。 

根据 内 参数 矩阵 KK 和 单 应 性 矩阵 互 ,由 式 (2-31) 可 计算 出 每 幅 图 像 的 外 部 参数 . 

t =MRK Bb n —uK'h, tr =f Xr t = MK h, (2-37) 


这 里 的 尺度 因子 多 =1/ Kh | 21/ | Kh | 。 当 然 ,由 于 图 像 存 在 噪声 ,所 以 得 到 的 
s[n ^ rs] 并 不 一 定 完全 满足 旋转 矩阵 的 正 交 性 质 
通常 情况 下 ,摄像 机 镜头 是 有 畸变 的 。 当 考虑 径 向 畸变 时 ,以 上 述 获得 的 参数 作为 初始 
值 ,利用 最 大 似 然 准则 对 计算 结果 进行 非 线 性 优化 ,从 而 计算 出 所 有 参数 的 准确 值 。 


2.7 DM642 DSP 图 像 处 理 系 统 


TMS320DM642( 以 下 简称 DM642) Æ TI 公司 于 2003 年 推出 的 一 款 针 对 多 媒体 处 理 领 域 
应 用 的 DSP ,该 器 件 适用 于 网 络 摄像 机 、 视 频 点 播 . 多 通道 数字 录像 应 用 ,以 及 需要 高 质量 的 音 
视频 编 解 码 领域 。 


2.7.1 DM642 处 理 器 芯片 特点 


DM642 是 一 款 32 位 的 高 性 能 多 媒体 定点 处 理 器 ,属于 C6000 系列 DSP, 其 具有 高 性 能 、 
高 性 价 比 和 低 功 耗 的 优点 ,因此 被 应 用 于 各 种 领域 。 DM642 采用 了 德州 仪器 公司 开发 的 第 二 
代 高 性 能 超 长 指令 字 结构 VelociT1. 2TM ,使 其 更 适用 于 多 媒体 应 用 ,并 且 具 有 很 好 的 C6000 
系列 的 代码 兼容 性 能 。DM642 是 基于 C64x 核 构 建 的 ,集成 了 丰富 的 外 围 设备 和 接口 。 但 同 
时 ,TMS320DM642 与 C64x 系列 产品 相 比 ,增加 了 许多 针对 视频 和 图 像 处 理 的 特有 指令 ,使 其 
在 执行 视频 及 数字 图 像 处 理 算法 程序 时 更 加 得 心 应 手 。 芯 片 的 主要 性 能 特点 如 下 : 

(1) 处 理 速度 快 

DM642 建立 在 C64x DSP 核心 架构 基础 上 。 采用 德州 仪器 公司 开发 的 第 二 代 高 性 能 长 指 
令 架 构 VelocTI. 27" ,具有 极 强 的 处 理 能 力 。 内 部 具有 8 个 并 行 处 理 单元 ,并 行 处 理 指 令 的 能 
力 最 大 可 达 每 个 指令 周期 处 理 8 条 32 位 指令 , 即 一 个 指令 包 。600MHz 的 DM642 处 理 器 ,其 
对 应 的 时 钟 周期 为 1.67ns ,每 秒 可 执行 指令 数 达 4800MIPS 。 

此 外 ,DM642 有 两 个 乘法 器 ,每 个 乘法 器 单 周 期 可 执行 2 个 16 位 与 16 位 的 乘法 或 4 个 8 
位 与 8 位 的 乘法 运算 ;有 6 个 算术 逻辑 单元 ,每 个 单元 在 每 个 时 间 周 期 内 可 执行 2 个 16 位 或 8 
位 的 加 减 、 比 较 移 位 等 运算 。 在 并 行 架构 下 ,每 个 时 间 周 期 最 高 可 执行 8 条 32 位 指令 , 且 在 
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600MHz 频率 下 ,每 秒 可 执行 24 亿 次 16 位 的 乘 加 或 48 亿 次 8 位 的 乘 加 指令 。 在 这 种 强大 运 
算 能 力 下 ,对 于 复杂 度 较 高 与 数据 量 较 大 的 图 像 处 理 可 进行 实时 的 数据 运算 。 

(2) 通 信和 能 力 强 

基于 C64x 核 构 建 的 DM642 ,集成 了 丰富 的 外 围 接 口 。DM642 具有 3 个 可 灵活 配置 的 视 
频 端口 (VP0 ~ VP2) ,这 些 视频 端口 能 够 与 一 般 的 视频 解码 设备 的 交互 界面 无 颖 对接 ,支持 多 
分 辨认 和 多 种 视频 标准 。2 个 多 路 缓存 串口 ( McBSP) 能 够 和 多 种 标准 的 端口 相连 ,是 一 种 同 
步 串 口 ,能 够 双 工 传送 。 此 外 ,还 具有 1 个 16/32 位 的 主机 接口 (HPI) ,1 个 多 通道 串 行 音频 接 
HH ( MeASP) ,1 个 16 位 的 通用 输入 /输出 接口 (GPIO) ,1 个 10/100M 以 太 网 控制 器 (EMAC ) 接 
口 ,1 个 DC 总 线 模块 等 。 

(3) 存 储 容量 大 且 扩展 方便 

DM642 的 256kB 片 内 存储 器 ,可 构成 两 级 Cache 结构 (包括 程序 Cache 和 数据 Cache ) 。 
此 外 还 有 两 个 外 部 存储 器 接口 ,包括 1 个 64 位 宽度 (EMIFA ) 的 数据 总 线 接口 ,一 个 16 位 宽度 
的 (EMIFB ) 的 数据 总 线 接口 ;可 与 同步 存储 器 (SDRAM ) 以 及 异步 存储 器 (SARM ,EPROM ) 以 
及 FLASH 等 实现 无 缝 连接 ,便于 大 量 数据 的 存储 。 

(4) 低 功 耗 

在 图 像 处 理 中 ,为 了 对 数据 进行 高 速 处 理 , 要 求 芯片 有 较 高 的 主 频 , 但 这 势必 会 增加 功 耗 。 
在 DM642 工作 过 程 中 ,芯片 内 核电 压 仅 需 +1.4V,IO 口供 电 电压 仅 需 +3.3V ,整个 芯片 功 耗 
只 有 1.06W。 并 且 DM642 处 理 需 具有 “休眠 "或 “空闲 "模式 ,在 此 模式 下 ,处 理 吉 会 关闭 部 分 
功能 模块 的 时 钟 , 以 此 降低 系统 功 耗 。 


2.7.2 系统 结构 


DM642 图 像 处 理 系统 的 硬件 结构 主要 巾 图 像 采集 模块 .图像 处 理 模块 、 存 储 模块 和 电源 
模块 等 构成 。 系 统 的 硬件 结构 图 如 图 2-18 所 示 。 
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图 2-18 ”DM642 图 像 处 理 系统 硬件 结构 图 


系统 工作 时 ,首先 从 Flash 加 载 应 用 程序 ,完成 对 DM642 初始 化 ,通过 2C 总 线 完 成 对 视 
频 解 码 模块 的 初始 化 ,然后 开始 采集 图 像 。 将 由 外 部 图 像 采集 模块 采集 到 的 模拟 图 像 , 经 过 视 
频 解 码 模块 转化 为 数字 信号 后 ,经 由 视频 接口 送 入 SDRAM 中 ,再 经 SDRAM 传输 到 DM642 的 
数据 Cache 中 进行 数据 人 处理, 经 过 处 理 的 数据 通过 外 部 存储 侣 接口 送出 后 存储 。 下 面 对 系统 
的 各 个 模块 结构 及 特性 进行 详细 说 明 。 
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1 ) 图像 处 理 模 块 一 一 DM642 内 部 概述 
DM642 处 理 需 由 CPU 内 核 . 外 设 和 缓存 三 个 主要 部 分 组 成 ,其 功能 结构 如 图 2-19 所 示 。 
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图 2-19 DM642 处 理 器 功能 结构 图 





(1)DM642 处 理 器 的 内 核 
从 图 2-19 可 知 ,DM642 处 理 需 的 内 核 主 要 由 :程序 取 指 令 单 元 指令 分 配 单元 、 指 令 解 码 
单元 、 两 个 数据 通道 A 和 了 B( 包 括 8 个 功能 单元 LI ,L2,M1,M2,S1 ,S2,D1 ,D2) \ 两 个 通用 寄存 
器 组 A 和 B、64 个 32 位 寄存 髓 控制 寄 存 髓 、 控 制 逻辑 测试 仿真 及 中 断 逻 辑 等 构成 。 
三 == 
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在 DM642 工作 时 ,在 一 个 CPU 时 钟 周 期 内 程序 取 指 令 单 元 、 指 令 分 配 单元 、 指 令 解 码 单 
元 可 以 搬运 8 个 32 位 的 指令 。 指 令 可 以 在 数据 通道 A 或 B 任意 一 个 中 进行 处 理 ,每 个 数据 
MÉH LMS D 寄存 器 组 用 来 设 定 和 控制 不 同 处 理 器 的 操作 。 

(2) DM642 处 理 器 的 外 设 

DM642 处 理 器 的 片上 资源 十 分 丰富 ,简单 地 可 以 归纳 如 下 :3 个 可 灵活 配置 的 视频 口 
(VP0 ~ VP2) ,能 与 主流 视频 编码 器 、 解 码 吉 芯 片 实 现 无 缝 连接 ,支持 RAW 视频 格式 和 BT. 656 
数据 格式 等 多 种 视频 标准 ;3 个 32 [7 B 38L FH XE IE 38:2. 个 多 通道 串 行 接口 (MecBSP) ,采用 
RS232 电 平 驱动 ;1 个 多 通道 串 行 音 频 接 口 (MecASP) ,支持 多 种 音频 格式 ;1 个 内 插 控制 单元 接 
O (VCXO) ,支持 音 / 视 频 同 步 ;1 个 EDMA 控制 器 ,具有 64 路 独立 通道 ;1 个 可 灵活 配置 的 16/ 
32 位 主机 接口 (HPI) ,与 PCI 接口 EMAC 接口 引 脚 复 用 ;1 个 32 fi, 3. 3V ,66MHz €/M PCI 
接口 ,遵循 PCI2.2 协议 ;1 个 10/100M EMAC 以 太 网 接口 ,符合 IEEE 802.3 标准 ;1 个 64 位 的 
外 部 存储 器 接口 (EMIFA) ,用 来 扩展 SDRAM 和 FLASH 存储 器 ,最 大 寻 址 空间 为 1024Mbit;1 
个 管理 数据 输入 /输出 模块 (MDIO);1 个 PC 总 线 模块 ;1 个 16 位 的 通用 输入 /输出 端口 
(GPIO) ;1 个 JTAG 接口 ,符合 IEEE 1149. 1 标准 。 

(3)DM642 的 Cache 结构 

在 处 理 器 中 ,虽然 片上 存储 需 速 度 快 ,但 容量 小 .成 本 高 ;而 片 外 存储 器 容量 大 .成 本 低 , 却 
速度 慢 。 因 此 ,为 了 解决 存储 器 容量 和 速度 及 成 本 之 间 的 矛盾 ,产生 了 多 级 存储 器 体系 结构 。 
这 一 结构 就 是 把 存储 器 分 为 若干 级 别 ,寄存 器 离 处 理 器 最 近 , 速 度 最 快 ,容量 最 小 ;高 速 缓存 
( Cache) 速度 次 之 ,容量 较 大 ; EH (Memory) Bj. CPU 最 远 ,速度 最 慢 ,但 容量 很 大 。 

存储 器 的 读 取 速 度 和 大 小 ,能 够 直接 影响 到 处 理 器 的 处 理 速度 。 因 此 存储 器 模块 的 设计 
与 DM642 的 性 能 直接 相关 。DM642 的 高 性 能 得 益 于 CPU 的 两 级 高 速 缓存 结构 ,结构 图 如 
图 2-20 所 示 。 
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图 2-20 DM642 两 级 存储 器 结构 图 
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从 图 2-20 中 可 以 看 出 ,在 DM642 内 ,CPU 直接 和 LIl 数据 缓存 控制 器 L1 程序 缓存 控制 器 
相连 ,管理 的 两 块 Cache 大 小 均 为 16KB , 作为 一 级 缓存 ,工作 在 CPU 全 速 访 问 状态 。 二 级 组 
存 大 小 为 256KB ,其 分 段 和 大 小 分 配 也 有 很 多 种 配置 。 通 过 对 高 速 缓存 配置 寄存 器 的 修改 可 
以 实现 不 同 的 配置 方式 ,可 以 配置 为 全 部 作为 外 部 内 存 的 映射 ,也 可 以 配置 为 既 有 直接 映射 义 
有 4 路 集合 相关 法 的 方式 。 

2) 图 像 采 集 模块 

摄像 头 将 采集 到 的 模拟 图 像 ,经 过 视频 输入 端 送 入 视频 解码 芯片 ,将 模拟 图 像 信号 转化 为 
数字 图 像 信号 。 不 同 的 视频 解码 芯片 性 能 稍 有 不 同 , 这 里 以 TVP5150 来 做 说 明 。TVP5150 是 
TI 公司 推出 的 一 款 支 持 多 种 视频 格式 , 且 超 低 功 耗 的 视频 解码 芯片 ,TVP5150 正常 工作 时 , 功 
HERA 115MW, 

将 DM642 的 VP1 和 VP2 的 A.\B 通道 配置 为 视频 采集 模式 ,系统 可 以 同时 采集 4 路 图 像 
信息 。TVP5150 和 DM642 的 连接 关系 如 图 2-21 所 示 。 将 TVP5150 和 DM642 的 I2C 总 线 接口 
SCL 和 SDA 互 连 ,TVP5150 的 视频 输出 口 YOUT[ 7:0) 和 DM642 的 VPOD[ 9:2 ] 相连, 将 
TVP5150 的 SCLK 口 和 INTREQ 与 DM642 的 VP 口 时 钟 相连 。 


VPOCLKO SCLK 


VPOCTLO INTREQ 
VPOD[9:2] YOUT[7:0] 





DM642 I2C 总 线 切 换 器 
K| 2-21 DM642 fll TVP5150 相连 


DM642 通过 I2C 总 线 对 TVP5150 进行 访问 。DM642 工作 在 主机 模式 ,TVP5150 工作 在 从 
机 模式 ,由 于 I2C 总 线 在 从 机 应 答 时 需要 从 机 的 地 址 101110X1 ,这 里 的 X 代表 0/1 ,这 样 从 机 
就 只 能 有 两 位 地 址 ,而 由 图 2-21 可 见 , 这 里 要 用 到 4 Fr TVP5150 ,因此 必须 使 用 I2C 总 线 切换 
器 对 4 Hr TVP5150 进行 访问 。 如 图 2-22 所 示 , 当 DM642 的 GPO 为 低 时 ,DM642 通过 120 总 线 
实现 与 TVP5150(0) 和 TVP5150(1 ) 的 通信 ; 当 DM642 的 GPO 为 高 时 ,DM642 通过 I2C 总 线 实 
ME TVP5150(2) 和 TVP5150(3 ) 的 通信 。 


TVP5150(0) 
TVP5150(1) 


TVP5150 (2) 
TVP5150(3) 
SN74CBTLV3257 


图 2-22 DM642 的 12C 总 线 和 TVP5150 相连 
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3 ) 存 储 模 块 

图 像 视 频数 据 和 程序 的 存储 需要 大 量 的 空间 ,虽然 DM642 芯片 内 有 16KB 的 一 级 程序 组 
存 ,16KB 的 一 级 数据 缓存 和 256KB 的 程序 数据 共享 二 级 缓存 ,但 如 果 没 有 扩展 的 存储 设备 ， 
对 于 直接 处 理 图 像 数据 的 系统 是 远 远 不 够 的 ,因此 对 于 存储 设备 的 扩展 是 十 分 必要 的 。 按 扩 
展 的 用 途 ,可 以 分 为 对 系统 程序 存储 的 扩展 和 外 部 同步 数据 存储 器 的 扩展 。 

(1) 对 系统 程序 存储 的 扩展 。 程 序 存储 时 要 求 能 够 掉 电 不 丢失 ,考虑 到 这 一 特性 ,可 以 选 
择 E’ PROM 或 者 Flash ,但 是 Flash 具有 较 快 存 取 时 间 、 电 可 擦 除 、 容 量 大 、 在 线 ( 系 统 内 ) 可 编 
程 \ 价 格 低廉 ,以 及 足够 多 的 擦 写 次 数 (1 x10") 和 可 靠 性 等 优点 ,已 成 为 新 一 代 控 制 系统 的 首 

(2) 对 外 部 同步 数据 存储 器 的 扩展 。 对 外 部 同步 数据 存储 器 ,要 求 存储 容量 足够 大 ,能 满 
足 图 像 数据 处 理 的 需要 ,而且 由 于 DM642 的 EMIF 是 64 位 的 ,为 了 使 DM642 达到 最 大 存储 速 
度 ,应 该 设计 64 位 的 同步 数据 存储 器 。 可 以 考虑 使 用 SDRAM ,虽然 它 不 具有 掉 电 保持 数据 的 
特性 ,但 其 存 取 速度 大 大 高 于 Flash。 例 如, 我们 可 以 选取 两 片 同步 动态 随机 存储 器 
MT48LC4M32B2 ,每 片 16MB 字 节 ,一 共 是 32MB 字 节 的 存储 空间 ,并 且 MT48LC4M32B2 每 片 
32 的 数据 线 , 第 一 片 接 在 EMIF 的 DO 到 D31 ,第 二 片 接 在 D32 到 D63 上 。 在 DM642 一 次 64 
位 数据 访问 中 会 同时 访问 到 两 片 SDRAM ,这 样 既 实 现 对 外 部 数据 存储 器 的 扩展 ,又 能 大 大 提 
高 存 取 速 度 。 


2.8 DM642 图 像 处 理 系统 的 CCS5.2 配置 


2.8.1 CCS 集成 开发 环境 特点 


Code Composer Studio&amp'" ( CCS 或 CCStudio) 是 一 种 针对 TMS320 系列 DSP 开发 和 调试 
的 集成 开发 环境 ,在 Windows 操作 系统 下 ,采用 图 形 接口 界面 ,提供 环境 配置 源 文件 编辑 \ 程 
序 调试 .跟踪 和 分 析 等 工具 ,可 以 对 开 公 司 出 品 的 DSP 进行 软件 调试 ,包含 各 种 TI 设备 系列 
的 编译 器 ` 源 代码 编辑 器 项目 生 成 环境 、 调 试 程序 、 探 查 器 、 模 拟 器 和 其 他 许多 功能 。CCStu- 
dio 提供 一 个 单一 用 户 界 面 , 指 导 用 户 完成 应 用 程序 开发 流程 的 每 一 步骤 ,支持 C/C + + 和 汇 
编 的 混合 编程 。 

CCS 的 开发 系统 主要 由 DSP 集成 代码 产生 工具 ,CCS 集成 开发 环境 ,DSP/BIOS 实时 内 核 
插件 及 其 应 用 程序 接口 API, 实 时 数据 交换 的 RTDX 插件 以 及 相应 的 程序 接口 API, K TI 公司 
以 外 的 第 三 方 提供 的 各 种 应 用 模块 插件 等 组 件 构 成 ,并 集成 以 下 具体 功能 : 

(1) 具 有 和 集成 可 视 化 代码 编辑 界面 ,用 户 可 通过 其 界面 直接 编写 C .汇编 . cmd 文件 等 。 

(2) 含 有 集成 代码 生成 工具 ,包括 汇编 器 、 优 化 C 编译 带 \ 链 接 咒 等 ,将 代码 的 编辑 编译 、 
链接 和 调试 等 诸多 功能 集成 到 一 个 软件 环境 中 。 

(3) 高 性 能 编辑 器 支持 汇编 文件 的 动态 语法 加 亮 显示 ,使 用 户 很 容易 阅读 代码 ,发 现 语法 错误 。 

(4) 工 程 项 目 管 理工 具 可 对 用 户 程序 实行 项 目 管理 。 在 生成 目标 程序 和 程序 库 的 过 程 
中 ,建立 不 同 程序 的 跟踪 信息 ,通过 跟踪 信息 对 不 同 的 程序 进行 分 类 管理 。 

(5) 基 本 调试 工具 具有 装 人 执行 代码 查看 寄存 器 存储 器 反 汇 编 . 变 量 窗口 等 功能 ,并 
支持 C 源 代码 级 调试 。 

e n 
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(6) 断 点 工具 ,能 在 调试 程序 的 过 程 中 ,完成 硬件 断 点 、 软 件 断 点 和 条 件 断 点 的 设置 。 

(7) 探 测 点 工具 ,可 用 于 算法 的 仿真 ,数据 的 实时 监视 等 。 

(8) 分 析 工 具 , 包 括 模拟 器 和 仿真 器 分 析 , 可 用 于 模拟 和 监视 硬件 的 功能 评价 代码 执行 
的 时 钟 。 

(9) 数 据 的 图 形 显 示 工 具 , 可 以 将 运算 结果 用 图 形 显示 ,包括 显示 时 域 / 频 域 波形 、 眼 图 、 
星座 图 图像 等 ,并 能 进行 自动 刷新 。 

(10) 提供 GEL 工具 。 利 用 GEL 扩展 语言 ,用 户 可 以 编写 自己 的 控制 面板 /菜单 ,设置 
GEL 菜单 选项 ,方便 直观 地 修改 变量 ,配置 参数 等 。 

(11) 支 持 多 DSP 的 调试 。 

(12) 支 持 RTDX 技术 ,可 在 不 中 断 目标 系统 运行 的 情况 下 ,实现 DSP 与 其 他 应 用 程序 的 
数据 交换 。 

(13) 提供 DSP/BIOS 工具 ,增强 对 代码 的 实时 分 析 能 力 。 


2.8.2 ”安装 过 程 
CCSv5. 2 的 安装 步骤 如 下 ; 


(1) 双 击 安装 程序 ,出 现 安装 程序 许可 协议 界面 ,如 图 2-23 所 示 。 选 择 第 一 行 的 “1 accept 
the terms of the license agreement”, 然 后 单 击 “ Next" ,进入 下 一 步 。 











| [Code Composer Studio 5.2 Software License Agreement 


| [IMPORTANT — PLEASE READ THE FOLLOWING LICENSE A! 


| 
; I accept the terms of the license agreement. 
£3 1 do not accept the terms of the license agreement. 





| Texas Instruments 


图 2-23 ”安装 程序 许可 协议 界面 

(2) 选 择 软件 安装 位 置 。 

软件 的 默认 安装 位 置 为 “C: \ti”, 如 图 2-24 所 示 。 如 果 需 要 更 改 安装 路 径 ,可 以 点 击 
“Browse…”, 选 择 所 需 的 安装 路 径 ,如 图 2-25 所 示 , 选 择 好 安装 路 径 后 点 击 “OK” 即 可 进入 下 一 步 。 

(3) 选 择 安装 版 本 。 如 图 2-26 所 示 , 此 处 我 们 选择 “Custom” ,完成 后 点 击 “ Next” HEA F 
一 步 。 
其 功能 如 下 : 
D“ Custom( HEX)” ,用 户 选择 支持 器 件 。 
(@ “Complete Feature Set( 全 器 件 版 本 )”, 默 认 安 装 全 部 器 件 , 但 占用 空间 较 大 。 
(4) 安 装 所 需 的 设备 序列 ,以 获得 最 佳 性 能 ,如 图 2-27 所 示 。 

m EA 
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Choose Installation Location 
Where should Code Composer Studio v5 be installed? 


| CCS Install Folder 
c 


| ]1nstall CCS plugins into an existing Eclipse installation 





Texas Instrumente 








图 224 选择 安装 路 径 








Choose Installation Location for Code Composer ... Milite 


cg est gi 













| Please choose a directory, then click OK. 
D:Ycs5,2 i muy 







3603s &- xi SR T 
Altium Designer Winter 09 Build.8.3.0. 16776 








pam 







Select the setup type that best suits your needs. 


一- 一 T cuc 


Click the type of Setup you prefer. 





Fe — P Kd 
omplete Feature Set | Select this option If you wish to 
| customize the individual features that 


are installed. 








Texas Instruments 












Ec mim rem] 
图 2-26 选择 安装 版 本 
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Select Processor Architectures to be installed 








CEx DSP + ARM processors 
LI Davind video Processors 
回 c6ooo single Core DSPs 
C6000 Multi Core DSPs 

O omar 

EZ] csooo ultra Low Power DSP 





I Select All 
Download size: 1076 MB. Install size: 4842.0 MB. 





Texas Instruments 








图 2-27 选择 需要 安装 的 设备 序列 
(5) 组 件 安装 。 根 据 所 选择 的 版 本 ,此 屏幕 会 有 所 不 同 ,如 图 2.28 BER. di Next EA 
T. 


















Select the components you want installed and deselect components you 
want to leave out. 









TI C6000 Compiler Tools | 
TI C5400 Compller Tools | 
回 71 c5500 Compiler Tools | 
Documentation | 
a Device Software | 
回 ceezrio | | 


FA ee mrar e SERAN ne EE 







Download size: 1076 MB. Install size: 4842.0 MB. Spedali | č | 


Texas Instruments 














图 2-28 组件 


(6) 下 一 步 显 示 所 选 安装 选项 的 摘要 ,如 图 2-29 所 示 , 点 击 “ Ne 
Code Composer Studio v8 iud 


Select the emulators you want installed and deselect emulators you want to 
leave out. 













E] JTAG Emulator Support 
Blackhawk Emulators 
Spectrum Digital Emulators 
TI Emulators | | 
回 xpsloo Class Emulator Support | | 
LI TI x0s560 PCI Emulator | 





Download size: 1076 MB. Install size: 4842.0 MB. 





Texas Instruments 














图 2-29 ”摘要 
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(7) 进 入 安装 软件 界面 ,如 图 2-30 所 示 ,点 击 ^Next" 即 可 。 











图 2-30 ”软件 安装 界面 


在 安装 过 程 中 ,将 显示 图 2-31 所 示 的 安装 程序 主屏 幕 。 有 时 会 显示 “未 响应 "字样 
(图 2-32) ,请 耐心 等 待 组 件 安装 进程 完成 其 操作 。 























”图 2.32 显示 “未 响应 "字样 
Ee 
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(8) 完 成 安装 程序 之 后 ,将 显示 如 下 界面 ,如 图 2-33 所 示 ,点 击 “Finish” 完 成 安装 。 





Code Composer Studie | 5$ 


Code Composer Studio v5 
Installation Complete 


Code Composer Studio v5 has been 
successfully installed. 


Click Finish to exit the installation wizard. 


[V] Launch Code Composer Studio v5 














图 2-33 ”完成 安装 


2.8.3 创建 项 目 

1) 创建 项 目的 一 般 方 法 

(1) 进 入 工作 区 ,此 时 可 以 选择 菜单 “File 一 New 一 CCSProjeet( 文 件 一 新 建 一 CCS 项 目 )” 
创建 新 项 目 , 如 图 2-34 所 示 。 





ja OSP/BIOS v5x Spit fe 
a j* RTSC Configuretion Hi 
" 


Tre heo form fiter In the eh pane accepis keywords) conien that match he 
keyword(s) wi be displayed In the et pane. You can wikicard and "|" i 
separate more than one keywords. Dno Back ani Forward biton a Pe p e1 
this wendow fo ra gam between last wewed pages 


| G} These are some available examples and More an that you can 
download and install, click on the link for more 











图 2-34 新 项 目的 创建 


(2) 在 “Project Name” (项 目 名 称 ) 选 项 中 键入 新 项 目的 名 称 ,例如 这 里 将 项 目 命 名 为 
“Test”, 选 中 “Use default location" ( 使 用 默认 位 置 ) 选 项 (默认 启用 ) ,将 会 在 工作 区 文件 夹 中 
创建 项 目 ; 也 可 以 选择 一 个 新 位 置 [使 用 “ Browse. ..” (浏览 ... ) 按 钮 ] ,将 项 目 命 名 为 “Test”， 
如 图 2-35 所 示 。 

(3) 在 “Device” (设备 变量 ) 中 选择 “C6000”“ Generic C64XX Device" ,如 图 2-35 所 示 。 很 
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多 设置 选项 都 可 以 保留 默认 值 。CMD 文件 的 主要 作用 反映 了 存储 单元 的 大 小 ,同时 实现 对 
DSP 代码 的 逻辑 定位 ,是 沟通 物理 存储 器 和 逻辑 存储 地 址 的 桥梁 ,也 可 以 根据 实际 存储 空间 的 
分 配 编写 . cmd 文件 , 设 定 路 径 导 入 。 


|! CCS Project : il 
|! Create a new CCS Project. xv | 
H 


B Project name: Test 

|, Output type: “Executable — : E RA 
‘i [V] Use default location i 
li ation: GACCSS.2,1.00018 win3ATest 


Family 106000 n 


| Variant: «select or type filter text» vi ‘Generic C64xx Device. R “| 
| i 





|f Hello World || | i] 
| m 图 CéFle Examples " MI [| 


| Q « Back Nex » M Cancel 


图 2-35 创建 项 目 


可 以 选择 Empty Project ,然后 单 击 “ Finish” (ZR) 创建 项 目 , 如 图 2-35 所 示 。 所 创建 的 项 
目 将 显示 在 “CALC + + Projects" ( C/C + + 项 目 ) 选 项 卡 中 ,可 以 创建 或 添加 源 文件 。 

(DfE* C/C + + Projects" (C/C + + 项 目 ) 视 图 中 用 鼠标 右键 单 击 项 目 名 称 ,并 选择 “ Next 
一 Source File" ( 新 建 一 源 文 件 ) 。 在 打开 的 文本 框 中 ,键入 包含 与 源 代 码 类 型 对 应 的 有 效 
扩展 名 (.c、. C、. cpp、.c+ ++、. asm、. s64、. s55 等 ) 的 文件 名 称 。 单 击 “ Finish” (完成 ) 
BPEJ, 

DHE“ C/C + + Projects” (C/C + + 项 目 ) 选 项 卡 中 右键 单 击 项 目 名 称 ,选择 “ Add Files 
to Project" (将 文件 添加 到 项 目 ) ,将 源 文件 复制 到 项 目 目录 ,向 目录 添加 现 有 源 文 件 。 也 可 以 
选择 “Link Files to Project”( 将 文件 链接 到 项 目 ) 来 创建 文件 引用 ,将 文件 保留 在 其 原始 目 
录 中 。 

2) 生 成 活动 项 目 

在 创建 了 项 目 并 且 添 加 或 创建 了 所 有 文件 之 后 ,根据 菜单 “ Project 一 Build Active Project" 
(项 目 一 生成 活动 项 目 ) 生 成 项 目 。 

3) 配 置 生 成 属性 

选择 菜单 “SC/C + + Projects" (C/C + + 项 目 ) 之 后 ,在 视图 中 右键 单 击 项 目 , 并 选择 子 菜 
单 “Build Properties" (生成 属性 ) , 即 可 进入 配置 生成 属性 设置 界面 。 在 此 界面 可 以 配制 相应 
的 编辑 器 汇编 器 和 链接 器 ,如 图 2-36 所 示 。 


SSA 
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图 236 配置 生成 属性 


2.84 目标 配置 文件 的 设置 


在 启动 调试 器 之 前 ,需要 选择 并 配置 代码 将 要 执行 的 目标 位 置 。 目 标 可 以 是 软件 模拟 器 
或 与 开发 板 相 连 的 仿真 器 。CCSv5.2 的 配置 在 集成 开发 环境 内 部 完成 ,不 仅 可 以 创建 整个 系 
统 范 围 的 配置 ,还 可 以 创建 各 个 项 目的 单独 配置 ,每 个 目标 配置 更 改 后 无 须 重 新 启动 CCS. H 
标 配 置 过 程 如 下 : 

(1) 用 鼠标 右键 单 击 项 目 名称 , 并 选择 “ New 一 Target Configuration File" ( 新建 一 目标 配置 
文件 ) ,如 图 2-37 所 示 。 


















NT 
Target Configuration 
Create a new Target Configuration file. 
New 
d EJ Use shared location 
Veces Hed ~ File System... [Workspacen: 

















图 2-37 ”新建 目标 配置 文件 


(2) 单 击 “Finish”( 完 成 ) ,此 时 将 打开 目标 配置 编辑 器 。 

(3) 如果 采 用 硬件 仿真 , 则 选择 “Texas Instruments XDS 100v2 USB Emulator" 作为 连接 方 
式 ,选择 相应 的 芯片 作为 设备 ,如 图 2-39 所 示 。 

如 果 采 用 软件 仿真 ,选择 “Texas Instruments. Simulator" 作为 连接 方式 ,选择 “C64xx CPU 
Cycle Accurate Simulator”, 如 图 2-40 所 示 。 

(4) Fi" Save” 按 钮 进行 保存 , 自动 设置 * Active”( 活动 ) 。 每 个 项 目 可 以 拥有 多 个 目标 
配置 ,但 只 能 有 一 个 处 于 活动 状态 ,该 配置 将 会 自动 启动 。 要 查看 系统 现 有 的 所 有 目标 配置 ， 

-— em 
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则 需要 完成 以 下 菜单 选择 .“ View— Target Configuration" ( 查看 一 目标 配置 )。 选 择 “ Project 一 


Build All” 或 者 选择 CTRL + B 快捷 键 编 译文 件 。 





[Da ere 





Resource 
General 
2 Bulld 
4 C6000 Compiler 
proceesor Optione 
Optimization 
Debug Options 
include Options 
Performance Advisor 
Advanced Options. 
6002 tinker 
| Debug 


Skon adsaozed seilinys 





File ‘Edit View Navigate 
rid & 


ll; Project Ex. $2; 7 TI | 
| 4 gi feration -4 
5j Includes | 

d» Debug 1 

wy DM6azcmd | | 

È mainc | | 

1l 


jlmagett — E 
m Heratbon.ccxm. 


fi 3| DM642.ccxml 


2d eun 
l lx 


Binaries 











dr gss 5 





Configuration [pron LAcive. 


C Main 


Dutp ype: Evecitsoie 








Device 
Fariy cocoa 
Variant: <select or type fiter text» . | 





z] lappies to whole project | 
IF Manage the project's target--onfiguration sutomaticaly 


| Eonnacton: 


v Advanced temngs 


| Device endisnness: 


Compiler version: 





Qureut for 





t 
Linker commend füe 


Runtme support Nbrary “svtomatic ~ 


12.38 ”选择 合适 的 芯片 





fj ty CCS Debug [E " 


| pe - 





[£j main.c “0i 


g Dmeazcconi DONNER 


This section describes the general configuration about the target. 





Connection | Texas Instruments XOS1002 USB Emulator 


Device 


type filter text 


F1 TMS320C6414 
I] TMs320C6415 
TM$320C6416 
m TMS320C6418 
i TMS320C6421 
TMS320C6424 
TMS320C6452 
TMS320C6454 
|"; TMS320C5455 
TMS320C6457 


e 
re sia eias QN US Ran E 


Advanced Source 

























sfr Includes 
5 Debug | | 
ò DM6áLe | | 

i 


i$ mainc 


Imaget« E, | 








图 2-39 硬件 仿真 目标 配置 编辑 器 
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图 2-40 软件 仿真 目标 配置 编辑 器 





第 2 章 ”机 器 视觉 硬件 技术 


2.8.5 仿真 调试 工具 栏 

(1) 调 试 工具 

QCCS v5.2 的 调试 工具 可 以 对 程序 进行 编译 汇编 和 链接 ,成 功 之 后 会 在 工程 文件 夹 下 
自动 生成 文件 夹 Debug, 并 包括 与 工程 名 相同 的 . out 文件 ,通过 命令 将 程序 载 入 目标 系统 。 对 
程序 进行 编译 ,汇编 和 链接 ,同时 在 窗口 下 方 显示 进行 编译 ,汇编 和 链接 的 相关 信息 ,装载 . out 
文件 后 会 自动 弹出 反 汇 编 窗口 ,内 部 为 反 汇编 的 机 骨 指 令 , 通 过 该 窗口 可 以 认真 分 析 所 写 程序 
的 运行 过 程 以 及 其 运行 方式 ,查找 错误 ,作为 算法 程序 优化 的 依据 。 

CCS v5.2 的 集成 调试 程序 具有 用 于 简化 开发 的 众多 功能 和 高 级 断 点 。 条 件 断 点 或 硬 
件 断 点 以 全 C 表达 式 、 本 地 变量 或 寄存 器 为 基础 。 高 级 内 存 窗 口 允 许 检查 内 存 的 每 一 级 别 ， 
以 便 可 以 调试 复杂 的 缓存 一 致 性 问题 。CCS v5. 2 支持 复杂 的 多 处 理 器 或 多 核 系 统 的 开发 。 
全 局 断 点 和 同步 操作 提供 了 对 多 个 处 理 器 和 多 核 的 控制 。 

(@CCS v5.2 还 提供 了 内 存 窗 口 .寄存 器 窗口 和 变量 观察 窗口 ,便于 调试 分 析 时 观察 DSP 
存储 空间 .寄存 需 以 及 变量 值 的 变化 。 

(2) 分 析 工 具 

CCS v5. 2 的 交互 式 探查 器 能 快速 测量 代码 性 能 并 确保 在 调试 和 开发 过 程 中 目标 资源 的 
高 效 使 用 变 得 更 容易 。 探 查 器 使 开发 人 员 能 够 轻松 分 析 其 应 用 程序 中 指令 周期 内 或 其 他 事件 
内 的 所 有 C/C + + 函数 ,例如 缓存 未 命中 /命中 率 、 管 道 隔 栏 和 分 支 。 分 析 范 围 可 用 于 在 优化 
期 间 将 精力 集中 在 代码 的 高 使 用 率 方面 ,帮助 开发 人 员 开 发 出 经 过 优化 的 代码 。 分 析 可 用 于 
任何 组 合 的 汇编 .C+ + 或 C 代码 范围 。 为 了 提高 效率 ,所 有 分 析 设备 在 整个 开发 周期 中 都 可 
供 使 用 。 

(3 ) 脚本 环境 

脚本 (Screenplay ) 是 批 处 理 文件 的 延伸 ,是 一 种 纯 文本 保存 的 程序 。 一 般 来 说 ,计算 机 脚 
本 程序 是 确定 的 一 系列 控制 计算 机 进行 运算 操作 动作 的 组 合 ,在 其 中 可 以 实现 一 定 的 逻辑 分 
文 等 。 脚 本 语言 (Scripting language) 是 为 了 缩短 传统 的 “编写 .编译 .链接 3511" ( edit-compile- 
link-run) 过程 而 创建 的 计算 机 编程 语言 。 脚 本 ,简单 地 说 ,就 是 一 条 条 的 文字 命令 ,这 些 文字 
命令 是 可 以 看 到 的 (如 可 以 用 记事 本 打开 查看 、 编 辑 ) ,脚本 程序 在 执行 时 是 由 系统 的 一 个 解 
释 需 将 其 一 条 条 地 翻译 成 机 器 可 识别 的 指令 ,并 按 程序 顺序 执行 。 因 为 脚本 在 执行 时 多 了 一 
道 翻 译 的 过 程 , 所 以 它 比 二 进 制程 序 执行 效率 要 稍 低 一 些 。 脚 本 每 次 运行 都 会 使 对 话 框 逐 字 
重复 。 早 期 的 脚本 语言 经 常 被 称 为 批 处 理 语言 或 工作 控制 语言 。 一 个 脚本 通常 是 解释 运行 而 
非 编 译 。 脚 本 语言 通常 都 有 简单 .易学 、 易 用 的 特性 ,目的 是 能 让 程序 员 快 速 完成 程序 的 编写 
工作 。 而 宏 语言 则 可 视 为 脚本 语言 的 分 支 , 两 者 实质 上 相同 。 

对 于 一 些 脱 机 处 理 的 骨 入 式 任务 ,例如 测试 ,长 期 不 需要 用 户 交互 。 要 完成 此 类 任务 , 集 
成 开发 环境 ( Integrated Development Environment ,IDE ) 应 能 自动 执行 一 些 常 见 任务 。CCS v5.2 
拥有 完整 的 脚本 环境 ,允许 自动 进行 重复 性 任务 ,如 针对 测试 和 性 能 基准 测试 等 。 一 个 单独 的 
脚本 控制 台 人 允许 在 IDE 内 键入 命令 或 执行 脚本 。 

(4) 图 像 分 析 和 图 形 虚 拟 化 工具 

CCS v5.2 可 以 实现 图 像 分 析 及 图 形 虚 拟 化 的 功能 。CCS v5. 2 不 仅 可 以 采集 动态 图 像 并 


图 像 处 理 与 机 器 视觉 


进行 处 理 图 像 ,而 且 能 以 本 机 格式 查看 主机 PC 或 在 目标 电路 板 中 加 载 的 图 像 和 视频 数据 。 
应 用 CCS v5. 2 强大 的 集成 开发 环境 ,以 及 独特 的 调试 分 析 工 具 , 数 字 图 像 处 理 的 仿真 分 析 变 
得 更 加 直观 ,也 为 DSP 数字 图 像 处 理 系统 设计 提供 了 参考 ,这 样 可 以 简化 数字 图 像 处 理 的 前 
期 工作 ,还 可 以 缩短 图 像 处 理 系 统 的 设计 开发 周期 。 而 在 图 形 虚 拟 化 方面 ,CCS v5.2 能 够 以 
图 形 方式 查看 变量 和 数据 ,并 实现 数据 和 变量 窗口 的 自动 刷新 。 

(5)C/C + + 编译 器 

TI 已 经 开发 专门 为 了 最 大 程度 地 提高 处 理 器 的 使 用 率 和 性 能 而 优化 的 C/C + + 编译 器 。 
CCSVJ. 2 既 支 持 C 程序 设计 又 支持 C + + , 当 源 程序 的 文件 后 缀 采用 .c 时 ,CCS 用 C 编译 器 
编译 程序 , 当 使 用 . epp 后 缀 时 ,用 C + + 编译 器 。C/C + + 编译 器 针对 不 同 应 用 范围 不同 设 
备 对 象 .实现 不 同 功能 等 方面 ,支持 不 同 的 结构 优化 。 主 要 体现 在 : 

消除 公共 子 表达 式 ; 

@ 软 件 流水 ; 

@ 强 度 折 减 ; 

@ 自 动 增 量 寻 址 ; 

@ 基 于 成 本 的 寄存 器 分 配 ; 

@ 指 令 预 测 ; 

@ 硬 件 循环 ; 

ORAA; 

@ 矢 量化 。 

TI 编译 器 还 执行 程序 级 别 优化 ,在 应 用 程序 级 别 评估 代码 性 能 。 通 过 程序 级 别 视图 , 编 
译 器 能 够 像 具 有 完整 系统 视图 的 汇编 程序 开发 人 员 一 样 生 成 代码 。 编 译 器 充分 利用 此 应 用 程 
序 级 别 视图 , 找 出 能 够 显著 提升 处 理 器 性 能 的 折 中 。TI ARM 和 Microcontroller C/C + + 编译 
器 经 过 了 专门 针对 代码 大 小 和 控制 代码 效率 的 优化 。 它 们 具备 行业 领先 的 性 能 和 兼容 性 。 

(6) 模 拟 

模拟 器 向 用 户 提供 一 种 在 能 够 使 用 开发 板 之 前 开始 开发 的 方式 。 模 拟 器 还 具有 更 加 透彻 
地 了 解 应 用 程序 性 能 和 行为 的 优势 。 它 提供 了 几 种 模拟 器 ,让 用 户 能 够 权衡 周期 精确 性 .速度 
和 外 围 设备 模拟 , 一些 模拟 器 特别 适合 算法 基准 测试 , 而 另 一 些 特别 适合 更 加 详细 的 系统 
模拟 。 

(7) 软 仿真 调试 

软 仿真 调试 可 以 脱离 硬件 独立 执行 ,将 程序 代码 加 载 后 ,在 一 个 窗口 工作 环境 中 ,可 以 模 
拟 DSP 的 程序 运行 ,同时 对 程序 设置 断 点 , 单 步 执行 ,对 寄存 器 /存储 器 进行 观察 、 修 改 ,统计 
某 段 程序 的 执行 时 间 等 。 通 常 在 程序 编写 完 以 后 ,都 会 在 软件 仿真 器 上 进行 调试 ,以 初步 确定 
程序 的 可 运行 性 。 软 件 仿真 器 的 主要 缺点 是 仿真 不 够 完善 ,无 法 模拟 DSP 与 外 设 之 间 的 操 
作 , 仅 仅 是 模拟 DSP 芯片 内 部 在 实际 硬件 环境 下 的 功能 。 

(8) 硬 仿真 调试 

TI 设备 包含 高 级 硬件 调试 功能 。 这 些 功 能 包括 : 

(DIEEE 1149. 1 (JTAG) 和 边界 扫描 。 

@) 对 寄存 器 和 内 存 的 非 侵 入 式 访 问 。 
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@@ 实 时 模式 ,用 于 调试 与 不 得 禁用 的 中 断 进行 交互 的 代码 。 实 时 模式 允许 中 断 事件 挂 起 
后 台 代码 ,同时 继续 执行 时 间 关 键 中 断 服 务 例 程 。 

@ 多 核 操 作 , 例 如 同步 运行 步 进 和 终止 。 其 中 包括 跨 核 触 发 ,该 功能 可 以 让 一 个 核 触发 
男 一 个 核 终止 。 

高 级 事件 触发 (AET) ,可 在 选 定 设备 上 使 用 ,允许 用 户 依据 复杂 事件 或 序列 ,例如 无 效 
数据 或 程序 内 存 访问 ,终止 CPU 或 触发 其 他 事件 。 它 能 够 以 非 侵入 方式 测量 性 能 及 统计 系统 
事件 数量 (例如 缓存 事件 ) 。 

CCS v5.2 提供 有 关 选 定 设 备 的 处 理 融 跟踪 ,帮助 客户 发 现 以 前 “看 不 到 的 "复杂 实时 缺 
陷 。 跟 踊 能 够 探测 很 难 发 现 的 缺陷 一 事件 之 间 的 争 用 情况 、 间 向 式 实时 干扰 、 堆 栈 溢 出 朋 演 、 
失控 代码 和 不 停 用 处 理 器 的 误 中 断 。 跟 踪 是 一 种 完全 非 侵 入 式 调试 方法 ,依赖 处 理 器 内 的 调 
试 单元 ,因此 不 会 干扰 或 更 改 应 用 程序 的 实时 行为 。 跟 踪 可 以 微调 复杂 开关 密集 型 多 通道 应 
用 程序 的 代码 性 能 和 缓存 优化 。 处 理 吉 跟踪 支持 程序 .数据 `. 计 时 和 所 选 处 理 需 与 系统 事件 / 
中 断 的 导出 ,可 以 将 处 理 器 跟踪 导出 到 XDS560 跟踪 外 部 JTAG 仿真 器 或 选 定 设备 上 ,或 导出 
到 芯片 缓存 代入 式 跟 踪 缓存 (ETB) 上 。 

(9) 实 时 操作 系统 支持 

BIOS6. x 是 一 种 高 级 可 扩展 实时 操作 系统 ,支持 ARM926, ARM Cortex M3,C674x , C64x + 、 
C672x 和 基于 28x 的 设备 。 它 提供 DSP/BIOS 5. x 没有 的 若干 内 核 和 调试 增强 ,包括 更 快 .更 灵活 
的 内 存 管理 ,事件 和 优先 级 继承 互 斥 体 。 仿真 调试 工具 栏 如 图 2-41 所 示 。 
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图 2-41 调试 工具 栏 
图 中 ; e ”一 一 单 击 全 速 执行 程序 , 遇 到 断 点 停止; 


qp 一 一 单 击 暂 停 正在 执行 程序 ， 





Gi ”一 一 单 击 中 止 程序 , 回 到 编辑 模式 ; 

DA 号。 一 单 步 执行 , 遇 到 函数 或 子 程序 , 则 进入 函数 内 部 或 子 程序 ,黄色 箭 
(000 头 琉 示 C 语言 调试 ,绿色 箭头 表示 汇编 语言 调试 ; 

DAS 一 单 步 运行 , 遇 到 函数 或 者 子 程序 时 全 速 完成 ,不 进入 函数 内 部 或 

(00 T8 ik E JUR C 语言 调试 ,绿色 箭头 表示 汇编 语言 调试， 

真一 单 步 跳出 ,从 当前 子 程序 的 位 置 全 速 执行 后 续 子 程序 ,返回 到 调用 改 子 程 

指令 

一 一 启用 同步 模式 ; 

dh 一 复位 CPU ,程序 复位 ; 

返回 程序 初始 位 置 , 准 备 重新 执行 程序 ; 


v 





B 一 一 单 击 此 按钮 ,DEBUG A EL e BC HEUS 


es 
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2.9 本章 小 结 


机 器 视觉 技术 是 一 门 涉及 人 工 智能 、 神 经 生物 学 ,物理 学 、. 计 算 机 科学 图像 处 理 、 模 式 识 
别 等 诸多 领域 的 交叉 学 科 , 在 现代 自动 化 生产 的 工 况 监 视 、 成 品 检 验 和 质量 控制 以 及 各 种 生活 
中 的 监控 系统 等 领域 都 得 到 了 广泛 的 应 用 ,能 够 提高 各 行 各 业 的 操作 柔性 和 自动 化 程度 。 本 
章 讨论 了 机 器 视觉 硬件 技术 ,重点 对 光源 技术 、 光 学 镜头 技术 ,摄像 机 技术 、 图 像 采 集 技术 、 摄 
像 机 标定 技术 、DM642 DSP 图 像 处 理 系统 等 机 器 视觉 技术 进行 了 详细 描述 ,并 以 DM642 DSP 
系统 举例 介绍 了 其 集成 开发 环境 安装 和 使 用 过 程 。 





. CCD 与 CMOS 各 项 指标 的 区 别 是 什么 ? 其 各 自 的 适用 范围 是 什么 ? 
.摄像 机 典型 标定 方法 有 哪些 ? 

.选用 光学 镜头 要 考虑 哪些 因素 ? 

尝试 安装 CCSv5.2 ,并 与 TMS320DM642 DSP 实验 板 连接 调试 。 

. DM642 图 像 处 理 系统 硬件 组 成 有 哪些 模块 ? 

. 结合 具体 实际 应 用 ,利用 DM642 设计 机 器 视觉 系统 。 
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3.1 前 言 


数字 图 像 ,又 称 数码 图 像 或 数位 图 像 ,是 二 维 图 像 用 有 限 数字 数值 像素 的 表示 。 数 字 网 像 
是 模拟 图 像 数字 化 得 到 的 ,其 光照 位 置 和 强度 都 是 离散 的 ,完成 数字 化 操作 的 装置 是 图 像 传 感 
右 及 其 计算 机 接口 ,习惯 上 称 之 为 数字 成 像 系统 。 例 如 ,最 常见 的 可 见 光 图 像 传 感 器 和 成 像 系 
统 有 数码 相机 数码 摄像 机 和 扫描 仪 等 ,这 些 设备 可 以 分 别 用 于 现场 景物 的 数字 化 成 像 和 纸 介 
质 图 片 的 数字 化 成 像 。 目 前 ,图 像 传感器 主要 有 两 类 :一 种 是 电荷 耦合 器 件 (CCD ) ; 另 一 种 是 
互补 金属 氧化 物 半 导体 器 件 (CMOS ) ,在 第 2 章 中 已 经 进行 了 详细 介绍 。 

图 像 传感器 的 基本 原理 是 把 光学 图 像 转换 为 电信 号 , 即 把 人 射 到 传感器 光敏 面 上 按 空间 
分 布 的 光 强 信息 ,转换 为 按时 序 输出 的 电信 和 号 一 一 视频 信号 。 图 像 传感器 及 成 像 系 统 分 为 主 
动 和 被 动 两 种 。 主 动 传感器 带 有 主动 照射 源 ,照射 源 将 光线 或 其 他 射线 投射 到 景物 上 ,经 过 景 
物 表 面 的 反射 吸收 或 景物 内 部 的 吸收 衰减 ,传感器 接收 景物 表面 的 反射 射线 能 量 或 透射 射线 
能 量 , 并 对 其 进行 数字 化 成 像 。 被 动 传感器 则 利用 自然 光照 明 或 景物 主动 发 射 的 辐射 ,接收 到 
景物 的 漫 反 射 射线 能 量 或 主动 辐射 射线 能 量 ,并 对 其 进行 数字 化 成 像 。 

民用 数字 化 成 像 系 统 常 见 的 成 像 形式 包括 :可 见 光 成 像 X 射线 成 像 .CT 成 像 .MR 核磁 
共振 成 像 超声 成 像 红外 成 像 全 息 成 像 等 。 军 用 数字 成 像 系统 常见 的 成 像 形 式 包括 .可见 光 
RIR 红外 成 像 .SAR 成 像 .全 息 成 像 等 。 


3.2 图 像 的 数字 化 过 程 


3.2.1 连续 图 像 的 表示 

连续 图 像 的 表示 方法 有 两 种 :空域 法 和 频 域 法 。 

(1) 空 域 法 

设 C(x,y,t, 和 A) 代 表 像 源 的 空间 辐射 能 量 分 布 ,其 中 (x,y) 是 空间 坐标 ,t 表示 时 间 , 和 A 表示 
波长 ,在 实际 成 像 过 程 中 ,以 上 各 个 量 分 别 受到 以 下 限制 。 

因为 光 的 强度 总 是 实 正 量 ,所 以 图 像 的 光 函 数 是 实数 且 非 负 。 同时 ,实际 的 成 像 系 
统 对 图 像 的 最 大 亮度 进行 了 某 些 限制 ,因此 ,0<C(x,y,it, 和 A)4, 其 中 ,4 是 图 像 最 大 
亮度 。 

@ 实 际 图 像 的 大 小 必然 受到 成 像 系 统 和 录像 介质 的 限制 。 为 了 数学 分 析 的 方便 ,不 妨 设 
所 有 的 图 像 只 在 某 一 矩形 区 域内 非 零 , 即 -L Sx &L,, -L Sy mL. 
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3 实际 成 像 只 是 在 有 限时 间 内 曝光 ,因此 , -TST 
另外 ,观察 者 对 图 像 光 函 数 的 亮度 响应 为 : 


fs) = [Guys t5, (4A (3-1) 


其 中 ,5,(A) 代 表 光 效 函 数 ,下 标 i 分 别 表示 红 \ 绿 \ 蓝 三 基色 。 在 大 部 分 成 像 系统 中 , 帧 图 
像 成 像 在 很 短 的 时 间 内 完成 ,此 时 可 以 认为 图 像 不 随时 间 改 变 , 因 而 ,时 间 变 量 也 可 以 从 图 像 
中 略 去 。 最 后 ,静止 的 连续 图 像 可 以 用 连续 的 空间 函数 .所 x,y) 来 表示 。 

(2) 频 域 法 

频 域 法 是 指 连续 图 像 的 频谱 表示 法 , 即 图 像 的 连续 傅立叶 变换 。 二 维 图 像 函 数 /f(x,y) 的 
连续 传 立 叶 变换 为 ， 


F(u,s) = | f f(x) dudv (3-2) 
相应 地 ,也 可 以 由 频 域 直接 变换 到 空域 ( 即 传 立 叶 逆 变 换 ) : 
Kasy) =| | FQuso)e nimm duds (33) 


Hop Le? rg epr( 生 全) 分 别 表示 正 变换 核 和 逆 变 换 核 ;z,y 为 空域 值 ju,v 为 频 域 值 ; 
F(u,v) IER 5 f(x y) 的 频谱 。 

3.2.2. ”数字 化 原理 

图 像 是 一 种 二 维 的 连续 函数 ,在 计算 机 上 对 图 像 进 行 数 字 处 理 时 ,首先 必须 对 其 在 空间 和 
亮度 上 进行 数字 化 ,这 就 是 图 像 的 采样 和 量化 的 过 程 。 图 像 上 空间 坐标 在 (*,y) 处 像素 点 的 
数字 化 称 为 图 像 采 样 ,而 幅 值 数字 化 称 为 灰 度 级 量化 。 

1. 采样 和 量化 

数字 化 的 过 程 主要 包括 两 个 方面 :采样 和 量化 。 

(1) 采 样 

采样 就 是 把 空间 上 连续 的 模拟 图 像 变换 成 离散 点 集合 的 一 种 操作 , 即 对 图 像 f(x,y) 的 空 
间 位 置 坐 标 (x*,y) 离散 化 以 获取 离散 点 函数 值 的 过 程 称 为 图 像 的 采样 ,各 离散 点 称 为 采样 点 ， 
采样 的 实质 就 是 要 用 若干 点 来 描述 一 幅 图 像 ,采样 点 对 应 模拟 图 像 数字 化 得 到 的 数字 图 像 像 
素 的 行 和 列 。 例 如 :一 副 640 x480 分 辩 率 的 图 像 ,表示 这 幅 图 像 是 由 640 x480 = 307200 个 像 
素 点 组 成 。 

(2) 量 化 

连续 图 像 经 过 采样 后 得 到 的 网 像 是 定义 在 离散 空间 域 上 的 二 维 离散 图 像 ,此 时 图 像 还 不 
是 数字 图 像 , 因 为 样本 图 像 在 空间 离散 点 ( 即 像素 ) 上 的 值 仍 然 是 一 个 连续 量 。 为 了 便于 计算 
机 人 处理, 必须 对 离散 图 像 的 值 进行 量化 处 理 , 也 就 是 要 将 离散 图 像 的 值 表示 为 与 其 幅度 成 比例 
的 整数 。 

量化 就 是 把 图 像 各 个 采样 点 上 连续 的 亮度 空间 变换 成 离散 值 或 整数 值 的 一 种 操作 ,这 种 
对 采样 点 上 图 像 的 亮度 幅 值 1 进行 离散 化 的 过 程 称 为 图 像 量化 。 一 般 的 量化 过 程 是 预先 设置 
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一 组 判决 电 平 ,每 个 判决 电 平 覆盖 一 定 的 空间 ,所 有 的 判决 电 平 覆 盖 整 个 有 效 取 值 区 间 。 然 后 
将 像素 点 的 采样 值 与 这 些 判 决 电 平 进行 比较 , 若 采 样 值 幅 度 落 在 某 个 判决 电 平 的 覆盖 区 间 之 
上 , 则 规定 该 采样 值 取 这 个 量化 级 的 代表 值 。 量 化 得 到 的 整数 值 就 是 像素 的 灰 度 值 ,量化 所 允 
许 的 整数 值 总 阶 称 为 灰 度 级 或 灰 度 级 数 。 例 如 :如 果 以 4 位 存储 一 个 点 ,就 表示 图 像 只 能 有 
16 种 灰 度 ; 若 采 用 16 位 存储 一 个 点 , 则 有 2/5 265536 种 灰 度 。 所 以 ,量化 位 数 越 大 ,表示 图 像 
可 以 拥有 越 多 的 灰 度 等 级 ,自然 可 以 产生 更 为 细致 的 图 像 效 果 。 

模拟 图 像 的 数字 化 经 历 采 样 和 量化 两 个 过 程 。 把 数字 化 过 程 分 解 为 两 个 过 程 ,更 多 的 是 
具有 理论 的 意义 。 事 实 上 ,采样 和 量化 这 两 个 过 程 是 紧密 相关 、 不 可 分 割 的 ,而 且 是 同时 完成 
的 。 在 很 多 成 像 系 统 中 ,我 们 可 以 观察 到 原始 的 模拟 图 像 和 数字 化 后 的 数字 图 像 , 却 很 难 分 别 
观察 到 单独 的 采样 和 量化 的 工作 过 程 。 

数字 图 像 的 分 辩 率 是 图 像 数 字 化 精度 的 衡量 指标 之 一 ,定义 为 单位 长 度 内 所 包含 的 像素 
个 数 。 图 像 的 空间 分 辩 率 是 在 图 像 采 样 过 程 中 选择 和 产生 的 ,用 来 衡量 数字 图 像 对 模拟 图 像 
空间 坐标 数字 化 的 精度 。 图 像 的 亮度 分 辨 率 是 在 图 像 量 化 过 程 中 选择 和 产生 的 ,是 指 对 同一 
模拟 图 像 的 亮度 分 布 进行 量化 操作 所 采用 的 不 同 量化 级 数 ,也 就 是 说 可 以 用 不 同 的 灰 度 级 数 
来 表示 同一 图 像 的 亮度 分 布 。 

2. 采样 定理 

理论 上 ,图 像 分 辨 率 的 选择 由 数字 信号 处 理学 的 采样 定理 ( 奈奈 斯 特定 理 ) 来 规定 。 采 样 
定理 说 明了 一 个 问题 , 即 当 对 时 域 模拟 信号 采样 时 ,应 以 多 大 的 采样 周期 采样 , 方 不 致 丢失 原 
始 信 号 的 信息 ,或 者 说 ,可 由 采样 信号 无 失真 地 恢复 出 原始 信号 。 

设 对 模拟 图 像 f(x,y) 按 等 间距 网 格 均 匀 采 样 ,x、y 方向 上 的 采样 间隔 分 别 为 Ax、Ay。 定 
义 采 样 函 数 s(x,y) ,采样 后 的 图 像 (x,y) 应 等 于 原 模拟 图 像 f(x,y) 与 采样 函数 的 乘积 : 


s(x,y) BE. s - mAx,y — ny) (3-4) 


Salwar) = f(x,y)s(m,y) (3-5) 


设 A(x,y) 的 傅立叶 变换 为 (u,v) ,其 中 (u,v) 是 傅立叶 变换 域 , 即 图 像 频 域 上 的 坐标 。 
若 和 vw 分别 是 模拟 图 像 (x,y) 对 应 的 (u,v) 函数 的 最 大 空间 频率 , 则 只 要 采样 间隔 满足 
条 件 Ax 1/2u, FI Ay s 172v, ,此 时 模拟 图 像 f(x,y) 的 采样 结果 (x,y) 可 以 精确 地 无 失真 
地 重建 原 图 像 f(x,y)。 

在 图 像 空间 频率 最 大 值 确定 的 情况 下 ,采样 定理 规定 了 完全 重建 该 图 像 的 最 大 采样 间隔 ， 
也 就 是 说 ,实际 采样 时 至 少 应 保证 采样 间隔 不 大 于 采样 定理 规定 的 采样 间隔 。 反 过 来 说 , 当 实 
际 采 样 时 的 采样 间隔 确定 以 后 ,采样 定理 则 规定 了 图 像 中 具有 哪些 空间 频率 的 图 像 信号 是 可 
以 完全 重建 的 , 即 采样 后 的 图 像 将 达到 何 种 程度 的 空间 分 辨 率 。 

一 般 来 说 ,采样 间隔 越 小 ,图 像 空间 分 辩 率 越 高 ,图 像 的 细节 质量 越 好 ,但 对 成 像 设 备 、 传 
输 信道 和 存储 容量 的 要 求 也 越 高 。 所 以 ,工程 上 需要 根据 不 同 的 应 用 , 折 中 选择 合理 的 图 像 数 
字 化 采样 间隔 , 既 要 保证 应 用 所 需要 的 足够 高 的 分 辩 率 ,又 保证 系统 的 成 本 超出 可 以 接受 的 
范围 。 
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3.3 图 像 数 据 结构 


3.3.1 图 像 模式 


1. 灰 度 图 像 


灰 度 图 像 是 数字 图 像 最 基本 的 形式 , 灰 度 图 像 可 以 由 黑白 照片 数字 化 得 到 ,或 对 彩色 图 像 
进行 去 色 处 理 得 到 。 灰 度 图 像 只 表达 图 像 的 亮度 信息 而 没有 颜色 信息 ,因此 , 灰 度 图 像 的 每 个 
像素 点 上 只 包含 一 个 量化 的 灰 度 级 (及 灰 度 值 ) ,用 来 表示 该 点 的 亮度 水 平 ,并 且 通 常用 1 个 
字 节 (8 个 一 进 制 位 ) 来 储存 灰 度 值 , 并且 划分 成 0 ~ 255 共 256 个 级 别 ,0 表示 最 暗 ( 全 黑 )， 
255 表示 最 亮 ( 全 白 ) 。 典 型 的 灰 度 图 像 如 图 3-1 所 示 。 

BMP 格式 的 文件 中 并 没有 灰 度 图 这 个 概念 ,但 是 可 以 很 容易 地 用 BMP 文件 来 表示 灰 度 
图 。 方 法 是 用 256 色 的 调 色 板 ,只 不 过 这 个 调 色 板 有 点 特殊 ,每 一 项 的 RGB 值 都 是 相同 的 , 即 
RGB 82(0,0,07 ,(1:1,1) —09/(955,285,255) , (6,0,0) 99:861, (253,155 ,255) 9m 
全 白色 ,中 间 的 是 灰色 。 这 样 , 灰 度 图 就 可 以 用 256 色 图 来 表示 了 。 对 于 R=G =B 的 色彩 , 带 
入 YIQ 或 YUV 色彩 系统 转换 公式 中 可 以 看 到 其 颜色 分 量 都 是 0, 即 没有 色彩 信息 。 

灰 度 使 用 比较 方便 。 首 先 ,RGB 值 都 相同 ;其 次 ,图 像 数 据 即 调 色 板 索 引 值 ,也 就 是 实际 
的 RGB 亮度 值 ;另外 ,因为 是 256 色 的 调 色 板 ,所 以 图 像 数据 中 一 个 字 节 代表 一 个 像素 ;如 果 
是 彩色 的 256 色 图 ,图 像 处 理 后 有 可 能 会 产生 不 属于 这 256 种 颜色 的 新 颜色 ,所 以 ,图 像 处 理 
一 般 采 用 灰 度 图 。 

2. 二 值 图 像 

ee i ite ee i CARRA RANKER, BI Oo 和 1, 理 

上 只 需要 1 个 二 进 制 位 来 表示 。 在 文字 识别 RRR A Jw FE nn , RERA 
RAI 人 步 处 理 的 背景 和 需要 进 

- 步 处 理 的 前 景 目 标 ,以 便于 对 目标 进行 识别 。 图 3-2 所 示 为 对 图 3-1 灰 度 图 像 进行 二 值 化 
处 理 后 得 到 的 二 值 图 像 。 








图 3-1 REKK 图 3-2 二 值 图 像 
3. 彩色 图 像 


彩色 图 像 的 数据 不 仅 包含 亮度 信息 ,还 包含 颜色 信息 。 从 物理 学 角度 来 说 颜色 是 人 眼 对 
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于 不 同 波长 的 光线 的 一 种 映 象 。 颜 色 的 表示 方法 是 多 样 化 的 ,最 常见 的 是 三 基色 模型 ,例如 
RGB( Red/Green/Blue, 红 绿 蓝 ) 三 基色 模型 ,通过 调整 RGB 三 基色 的 比例 可 以 合成 很 多 种 颜 
色 。 因 此 RGB 模型 在 各 种 彩色 成 像 设备 和 彩色 显示 设备 中 使 用 ,常规 的 彩色 图 像 也 都 是 用 
RGB 三 基色 来 表示 的 ,每 个 像素 包括 红 绿 蓝 三 种 颜色 的 数据 ,每 个 数据 用 一 个 字 节 (8 位 二 进 
制 位 ) 表 示 , 则 每 个 像素 的 数据 为 3 个 字 节 ( 即 24 位 二 进 制 位 ) ,这 就 是 人 们 常 说 的 24 位 真 彩 
色 。 本 书 将 在 颜色 空间 中 详细 阐述 。 

3.3.2 ”颜色 空间 


颜色 空间 是 用 来 表示 像素 颜色 的 数学 模型 ,又 被 称 为 颜色 模型 。 颜 色 空间 是 通过 数学 方 
法 形象 化 表示 颜色 的 途径 ,人 们 常用 它 来 生成 和 描述 颜色 ,对 于 人 类 视觉 来 说 ,可 以 通过 色调 、 
饱和 度 和 透明 度 来 定义 颜色 ;对 于 显示 设备 来 说 ,人 们 通过 使 用 红色 .绿色 和 蓝 色 磷 光 体 的 发 
光量 来 描述 颜色 ;对 于 打印 或 者 印刷 设备 来 说 ,人 们 使 用 青色 . 品 红色 .黄色 和 黑色 的 反射 和 吸 
收 量 的 多 少 来 产生 指定 的 颜色 。 颜 色 空 间 常 用 三 维 模型 表示 ,空间 中 的 各 类 颜色 能 够 直接 看 
到 或 者 使 用 颜色 模型 产生 ,其 中 的 颜色 通常 用 三 维 坐标 来 描述 ,其 颜色 要 取决 于 所 使 用 的 坐 
标 。 实 质 上 ,颜色 模型 是 对 坐标 系统 和 子 空间 的 描述 ,位 于 系统 中 的 每 种 颜色 都 由 单个 点 来 表 
示 ,而 需要 对 颜色 进行 描述 或 者 使 用 的 时 候 , 颜 色 通 常用 三 个 相对 独立 的 属性 来 表示 ,三 个 独 
立 变量 的 综合 作用 所 构成 的 三 维 立体 结构 就 是 一 个 颜色 空间 ,构成 了 如 下 通用 表达 公式 : 

V = X(x) + Y(y) + Z(z) (3-6) 

式 (36) 说 明 颜色 可 以 从 不 同 的 角度 ,用 三 个 不 同属 性 加 以 描述 ,产生 不 同 的 颜色 空间 ,但 
被 描述 的 颜色 对 象 本 身 是 客观 的 ,不 同 颜色 空间 只 是 从 不 同 的 角度 去 衡量 同一 个 对 象 。 

1. 颜色 空间 的 分 类 

(1) 从 与 设备 的 关系 上 ,颜色 空间 可 笼统 地 分 为 两 类 

颜色 空间 分 为 与 设备 相关 和 与 设备 无 关 两 类 。 与 设备 相关 的 颜色 空间 ,是 指 颜色 空间 指 
定 生成 的 颜色 与 生成 或 显示 该 颜色 的 设备 有 关 。 例 如 :RGB 颜色 空间 是 与 显示 设备 相关 的 颜 
色 空间 ,显示 器 使 用 RGB 来 显示 颜色 ,用 各 像素 的 值 生成 的 颜色 将 随 显示 器 的 亮度 和 对 比 度 
的 改变 而 不 同 。 与 设备 无 关 的 颜色 空间 ,是 指 颜色 空间 指定 生成 的 颜色 与 生成 或 显示 该 颜色 
的 设备 无 关 。 例 如 ;CIE、L * a b 颜色 空间 就 是 与 设备 无 关 的 颜色 空间 ,它们 定义 在 HSV 
( Hue saturation and value) 颜色 空间 的 基础 上 ,用 该 空间 表示 的 颜色 无 论 在 什么 设备 上 生成 的 
颜色 都 是 相同 的 。 

(2) 从 人 类 视觉 对 颜色 的 感知 来 分 ,颜色 空间 可 分 成 三 类 

DHEA (mixture) 型 颜色 空间 :将 三 种 基色 按照 一 定 比 例 通过 某 种 通道 合成 颜色 。 例 如 ; 
RGB,CMY 和 XYZ 等 颜色 空间 就 属于 这 种 类 型 。 

@) 非 线性 亮度 / 色 度 (luma/chroma ) 型 颜色 空间 :用 两 个 独立 的 分 量 表示 色彩 的 感知 ,用 剩 
余 的 一 个 分 量 表示 非 色 彩 的 感知 。 当 仅 需 要 黑白 图 像 时 ,颜色 空间 只 需要 一 个 分 量 就 能 表示 。 
例如 :Lx*a*b,Lx*ux*v,YUV 和 YIQ 就 属于 这 种 类 型 。 

@ 强 度 / 饱 和 度 / 色 调 ( intensity/saturatio/ hue ) 型 颜色 空间 :用 饱和 度 和 色调 描述 色彩 的 感 
知 ,可 使 颜色 的 解释 更 直观 ,而 且 可 以 有 效 地 消除 亮度 的 影响 。 例 如 :HSI,HSL,HSV 和 LCH 
等 颜色 空间 。 
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(3) 从 技术 角度 区 分 ,颜色 空间 可 分 成 三 类 

(DRGB 型 颜色 空间 。 这 类 模型 主要 应 用 于 电视 机 和 显示 器 的 颜色 显示 系统 。 例 如 ; 
RGB,HSI,HSL 和 HSV 等 颜色 空间 。 在 显示 技术 和 印刷 技术 中 ,颜色 空间 经 常 被 称 为 颜色 模 
型 (Color Mode). “颜色 空间 "侧重 于 强调 颜色 的 表示 ,而 “颜色 模型 "侧重 于 强调 颜色 的 
合成 。 

XYZ 型 颜色 空间 /CIE 颜色 空间 。 这 类 颜色 空间 是 由 国际 照明 委员 会 定义 的 颜色 空间 , 
通常 作为 颜色 空间 标准 ,是 度量 颜色 的 基本 方法 。 国 际 照明 委员 会 定义 的 颜色 空间 采用 的 是 
与 设备 无 关 的 颜色 表示 法 ,现在 被 广泛 地 应 用 于 科学 计算 中 。 对 不 能 直接 相互 转换 的 两 种 颜 
色 空 间 , 可 利用 这 类 颜色 空间 作 过 渡 。 例 如 :CIE 1931 XYZ,L*a*b,L*u*v 和 LCH 等 颜色 
空间 就 可 作为 过 渡 性 的 转换 空间 。 

GYUV 型 颜色 空间 /电视 系统 颜色 空间 。 由 广播 电视 发 展 的 需求 推动 而 开发 的 颜色 
空间 ,主要 目的 是 通过 压缩 色 度 信息 ,以 便 快 速 有 效 地 播送 彩色 电视 图 像 。 例 如 ;YUV， 
YIQ,ITU-R BT. 601 Y’ CbCr, ITU-R BT. 709 Y’ CbCr 和 SMPTE-240M Y’ PbPr 等 颜色 
空间 。 

(4) 从 分 量 贡献 上 区 分 ,颜色 空间 可 细 分 成 三 类 

Q@ 加 法 模型 ,如 RGB 模型 ,用 不 同 强度 的 红色 .绿色 和 蓝 色相 加 组 合 来 产生 各 种 颜色 。 

@ 减 法 模型 :如 CMY(K) , YUV 模型 。 

@ 混 合 模型 。 

2. RGB 颜色 空间 

人 的 眼睛 通过 3 种 可 见 颜色 的 刺激 在 视网膜 的 锥 体 上 感知 彩色 ,这 些 可 见 颜 色 在 波长 约 
为 630nm( 红 ) .530nm( 绿 ) 和 450nm( 蓝 ) 处 具有 峰值 灵敏 度 ,通过 比较 光源 的 强度 而 感知 光 
的 颜色 。 可 见 三 色 刺 激 理论 是 以 红 、 绿 、 蓝 3 个 原始 色 为 基础 ,我 们 称 之 为 RGB 彩色 模式 , 因 
为 自然 界 中 所 有 的 颜色 都 可 以 用 红 、 绿 、 蓝 (RGB) 这 3 种 颜色 波长 的 不 同 强度 组 合 而 得 ,这 就 
是 人 们 常 说 的 三 基色 原理 。 因 此 ,这 3 种 光 常 被 人 们 称 为 三 基色 或 三 原色 。 

图 3-3 所 示 是 RGB 颜色 空间 ,可 以 通过 三 基色 合成 其 他 颜色 。 青 色 可 以 由 绿色 和 蓝 色 合 
成 ,洋红 (或 品 红 ) 可 以 由 红色 和 蓝 色 合 成 ,黄色 可 以 由 红色 和 绿色 合成 ,而 青色 洋红 和 黄色 
恰好 是 CMY( Cyan/ Magenta/Yellow) 三 基色 。 当 RGB 三 基色 以 等 比例 或 等 量 进行 混合 时 ,可 
以 得 到 黑 、 灰 或 白色 ,而 采用 不 同比 例 进行 混合 时 , 便 可 得 到 千变万化 的 颜色 。 

在 RGB 颜色 空间 中 ,任意 彩色 光 工 的 配色 方程 为 : 


L-r[R] *g[G] +b[B] (3-7) 


式 中 :r[R]、g[G]、6b[B] 一 一 彩色 光 工 的 三 基色 分 量 或 百分比 。 

RGB 颜色 空间 最 大 的 优点 就 是 直观 ,用 于 屏幕 显示 很 方便 。 其 缺点 首先 是 RG、B 三 个 
分 量 之 间 高 度 相 关 , 即 如 果 某 一 个 分 量 发 生 了 改变 ,那么 这 个 颜色 很 可 能 要 发 生 比 较 大 的 变 
化 ;其 次 是 人 眼 对 于 常见 的 红 绿 蓝 三 色 的 敏感 程度 是 不 一 样 的 ,因此 颜色 均匀 性 极 差 。 基 于 
RGB 空间 的 图 像 分 割 是 将 RGB 三 色 作为 三 个 互相 独立 的 特征 来 对 待 ,但 事实 上 RGB. 三 色 是 
有 联系 的 ,相关 性 较 强 ,分 别 考虑 不 太 符合 人 的 感知 和 思维 习惯 ,也 不 利于 分 辨 颜色 ,因此 
RGB 空间 并 不 适合 于 作 彩 色 图 像 分 割 用 。 
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a)RGB 三 基色 混 色 b)RGB 颜 色 空间 
图 3-3 RGB 三 基色 原理 图 


3. XYZ 颜色 空间 

由 于 RGB 颜色 空间 存在 很 多 缺点 ,因此 很 少 被 直接 应 用 在 图 像 处理 领 域 。XYZ 颜色 空间 
是 即 为 了 克服 RGB 颜色 空间 的 缺点 而 在 RGB 颜色 空间 的 基础 上 ,用 假想 的 三 个 原色 X 了 T、Z 
建立 的 一 个 新 的 颜色 空间 。 这 种 颜色 空间 本 身 与 设备 无 关 , 与 RGB 颜色 空间 相 比 具有 更 高 的 
可 移植 性 。 它 是 RGB 空间 的 线性 变换 ,具体 转换 公式 为 : 


X 20.49x R -0.3| x G-0.2x B (3-8) 
Y 20.177 x R-*0.812xG +0.011 x B (3-9) 
Z 20.001xG«0.99x B (3-10) 


虽然 XYZ 颜色 空间 是 对 RGB 颜色 空间 做 出 了 改进 ,并 且 包 含 人 类 能 够 感觉 到 的 所 有 颜 
色 , 然 而 ,由 于 XYZ 空间 不 具备 颜色 均匀 性 ,因而 并 不 适合 于 图 像 分 割 等 处 理 。 尽 管 如 此 ， 
XYZ 颜色 空间 仍然 很 重要 ,因为 它 构筑 了 其 他 颜色 空间 与 RGB 颜色 空间 之 间 的 桥梁 ,是 定义 
其 他 颜色 空间 的 基础 。 

4. CMY 颜色 空间 

青色 、 紫 红色 和 黄色 是 光 的 二 次 色 ,也 可 以 说 ,它们 是 颜料 的 原色 。 例 如 , 当 在 表面 涂 上 青 
色 颜 料 ,再 用 白光 照射 时 ,没有 红 光 从 表面 反射 。 也 就 是 说 ,青色 颜料 从 表面 反射 的 光 中 减 去 
T £D. 

大 多 数 将 颜料 堆积 于 纸 上 的 设备 ,比如 彩色 打印 机 和 复印 机 ,都 需要 CMY 数据 输入 ,或 在 
内 部 将 RGB 转换 为 CMY ,近似 地 转换 可 用 式 (3-11 ) SEHR; 

















G 1 R 
M|=|1|- (3-11) 
Y 1 B 





其 中 ,假想 所 有 的 颜色 值 都 已 经 归 一 化 在 [0,1] 之 间 。 式 (3-11) 证 明了 上 文 的 描述 ,从 涂 
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满 纯 青色 的 表面 反射 的 光 不 包含 红色 (公式 中 的 C=1 -R)。 同 样 ,纯净 的 紫红 色 不 反射 绿 
色 , 纯 净 的 黄色 不 反射 蓝 色 。 式 (3-11) 还 证 明 , 从 1 减 去 个 别 的 CMY 值 ,可 以 从 一 组 CMY 值 
很 容易 地 获得 RGB 值 。 理 论 上 ,等 量 的 颜料 原色 ,将 青色 .紫红 色 和 黄色 混合 会 产生 黑色 。 在 
实践 中 ,将 这 些 颜 色 混 合 印刷 会 生成 模糊 不 清 的 黑色 。 所 以 ,为 了 生成 纯正 的 黑色 (打印 中 主 
要 的 颜色 ) ,第 4 种 颜色 一 一 黑色 , 便 添加 进来 了 ,从 而 给 出 提升 的 CMYK 颜色 模型 。 由 此 , 当 
出 版 人 谈论 “4 色 印 刷 " 时 , 指 的 就 是 CMY。 

5. HSI 颜色 空间 

TE RGB 和 CMY 模型 下 产生 彩色 和 从 一 种 模型 转换 到 另 一 种 模型 是 比较 简单 的 过 程 , 这 
些 彩 色 系 统 在 硬件 上 的 实现 也 很 理想 。 另 外 ,RGB 系统 与 人 眼 很 强 地 感觉 红 绿 、 蓝 三 原色 的 
事实 能 很 好 的 匹配 。 但 是 ,RGB ,CMY 和 其 他 类 似 颜色 模型 不 能 很 好 地 解释 实际 上 人 眼 观 察 
到 的 颜色 。 例 如 ,首先 人 们 在 解释 颜色 时 并 没有 涉及 用 组 成 其 颜色 的 每 一 原色 的 百分比 给 出 
其 颜色 描述 ,因而 ,人 脑 中 并 不 认为 彩色 图 像 是 由 三 幅 原 色 图 像 合 成 了 一 幅 单 一 图 像 。 

当 人 观察 一 个 彩色 物体 时 ,用 色调 .色彩 饱和 度 和 亮度 来 描述 它 , 这 种 颜色 模型 就 是 HSI 
( Hue/Saturation/ Intensity ,色调 /饱和 度 / 强 度 ) 模 型 ,HSI 模型 是 从 人 类 的 色 视 觉 机 理 出 发 而 提 
出 的 。 

(1) 色 调 表 示 颜 色 ,颜色 与 彩色 光 的 波长 有 关 , 将 颜色 按 红 橙 黄 绿 青 蓝 紫 的 顺序 排列 定义 
色调 值 , 并 且 用 角度 值 (0。 ~ 360°) 来 表示 。 例 如 红 、 黄 \ 绿 、 青 、 蓝 、 洋 红 的 角度 值 分 别 为 0°、 
60° .120° .180° 240° FI 300°, 

(2) 色 彩 饱和 度 表示 色 的 纯度 ,也 就 是 彩色 光 中 参 杂 白光 的 程度 。 白 光 越 多 ,饱和 度 越 
低 ; 白光 越 少 ,饱和 度 越 高 且 颜 色 越 纯 。 饱 和 度 的 取 值 采 用 百分数 (0% ~ 10096 ) ,0% 表示 灰 
色光 或 白光 ,100% 表示 纯色 光 。 

(3) 强 度 表 示人 眼 感 受到 彩色 光 的 颜色 的 强 弱 程度 , 它 与 彩色 光 的 能 量 大 小 (或 彩色 光 的 
亮度 ) 有关, 因此 有 时 也 用 亮度 ( Brightness ) 来 表示 。 

在 处 理 彩 色 图 像 时 ,为 了 方便 ,经 常 要 把 RGB 三 基色 表示 的 图 像 数据 与 HSI 数据 相互 转 
换 。 由 RGB 颜色 空间 转换 到 HIS 颜色 空间 的 转换 公式 为 : 

0 B&G 


H = (3-12) 
360 - 0 BzG 


3 f 
Ds -negra RH (3-13) 
1= LOG +B) (3-14) 
SEN (R-G)+(R-B) 
其 中 ,0 = arccos 2L[(R- C) «[R-G](G -B) ] marum 


假定 RGB 值 已 经 归 一 化 在 [0,1] 之 间 , 将 以 式 (3-12 ) 中 得 出 的 所 有 结果 除 以 360。, 即 可 
将 色调 归 一 化 在 [0,1] 之 间 ,那么 其 他 的 两 个 HSI 分 量 则 也 在 [0,1] 之 间 。 
当 给 定 了 [0,1] 之 间 的 HSI 值 时 ,依靠 五 值 ,可 以 计算 出 其 对 应 到 的 RGB 颜色 空间 值 。 
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首先 ,用 360" 乘 以 瑟 , 这 样 就 将 色调 的 值 还 原 成 了 原来 的 范围 [10" ,360"] 。 如 果 H Æ RG 区 域 
(0? € Hx120?) A, JBA RGB 分 量 由 下 式 给 出 


ScosH 


R= ijy S 
[I * cos( 609 — H) 


6 c3 Ub (Sg 


B = I(1 - 8) 
如 果 给 出 的 五 值 在 GB DX ( 120?  H 240?) W , MEM PIRE 120°; 
H = H - 120? (3-16) 
那么 ,这 时 RGB 分 量 是 : 
R= I(1- S) 
* ScosH 
C - i[1 uester (3-17) 


B =3I- (R 6) 
n 45 HH B5 H IEE BR [X39 ( 240? <H <360°) A , MAEM PIRE 240? 
H = H - 240? (3-18) 
那么 ,这 时 RGB 分 量 是 : 


R 2 31 - (G « B) 
G = I(1 - 8) (3-19) 


ScosH ] 


B=I rhein RN 
[i * cote - H) 


6. YUV 颜色 空间 

在 现代 彩色 电视 系统 中 ,通常 采用 三 管 彩色 摄像 机 或 彩色 CCD( 电 耦合 需 件 ) 摄像 机 , 它 
把 得 到 的 彩色 图 像 信 号 ,经 分 色 、 分 别 放 大 校正 后 得 到 RGB 颜色 图 像 , 再 经 过 和 矩阵 变换 电路 得 
到 亮度 信号 Y 和 两 个 色差 信号 R-Y 5 B -YY, 最 后 发 送 端 将 亮度 和 色差 三 个 信号 分 别 进行 编 
码 , 用 同一 信道 发 送出 去 。 这 就 是 YUV 颜色 空间 的 定义 。 

采用 YUV 颜色 空间 的 重要 性 是 它 的 亮度 信号 Y 和 色 度 信号 UV 是 分 离 的 。 如 果 只 有 YY 
信号 分 量 而 没有 U、V 分 量 ,那么 这 样 表示 的 图 就 是 黑白 灰 度 图 。 彩 色 电 视 采用 YUV 空间 正 
是 为 了 用 亮度 信号 Y 解决 彩色 电视 机 与 黑白 电视 机 的 兼容 问题 ,使 黑白 电视 机 也 能 接收 彩色 
信和 号。 

根据 美国 国家 电视 制式 委员 会 NTSC 制式 的 标准 , 当 白 光 的 亮度 用 了 来 表示 时 , 它 和 红 、 
绿 、 蓝 三 色光 的 关系 可 用 如 下 式 的 方程 描述 


Y = 0.3R+0.59G +0.11B (3-20) 
这 就 是 常用 的 亮度 公式 。 色 差 UV 是 由 B - 工 与 R-Y 按 不 同比 例 压缩 而 成 的 。YUV 


颜色 空间 与 RGB 颜色 空间 的 转换 关系 如 下 ; 
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Y 0.3 0.59 0.11 R 
DIEN -10. 29 a [o (3-21) 
V 062 -052 -ü10J LB 

如 果 要 由 YUV 空间 转化 成 RGB 空间 ,只 要 进行 相应 的 逆 运 算 即 可 。 与 YUV 颜色 空间 类 
似 的 还 有 Lab 颜色 空间 , 它 也 是 用 亮度 和 色差 来 描述 颜色 分 量 ,其 中 工 为 亮度 ,a RI b 分 别 为 
各 色差 分 量 。 

3.3.3 图 像 存储 的 数据 结构 

数字 图 像 处 理 可 以 用 和 矩阵 来 表示 ,因此 可 以 采用 和 抢 阵 理论 和 和 矩阵 算法 对 数字 图 像 进行 分 
析 和 处 理 。 最 典型 的 例子 是 灰 度 图 像 ,如 图 3-4 所 示 。 灰 度 图 像 的 像素 数据 就 是 一 个 矩阵 , 算 
阵 的 行 对 应 图 像 的 高 (单位 为 像素 ) ,矩阵 的 列 对 应 图 像 的 宽 ( 单 位 为 像素 ) ,矩阵 的 元 素 对 应 
图 像 的 元 素 ,矩阵 元 素 的 值 就 是 图 像 的 灰 度 值 。 注 意 :按照 C 语言 的 习惯 ,图 像 和 矩阵 的 左上 和 角 
坐标 取 (0,0) 。 

由 于 数字 图 像 可 以 表示 为 矩阵 形式 ,所 以 在 计算 机 数字 图 像 处 理 程序 中 ,通常 用 二 维 数 组 来 
存放 图 像 数据 ,如 图 3-5 所 示 。 二 维 数组 的 行 对 应 图 像 的 高 ,二 维 数 组 的 列 对 应 图 像 的 宽 , 二 维 
数组 的 元 素 对 应 图 像 的 像素 ,二 维 数组 元 素 的 值 就 是 像素 灰 度 值 。 采 用 二 维 数组 来 存储 数字 图 
像 ,符合 二 维 图 像 的 行列 特性 ,同时 也 便于 程序 的 寻 址 操作 ,使 得 计算 机 图 像 编 程 十 分 方便 。 





M M 
f fT 
a) 数字 图 像 (MXN) a) 数字 图 像 (MXN) 
fo ha ES Jon- (00) (0,1) … … 和 (0,N-1) 
(1.0) H 
fio fia id fixa 1 (LD 
fuio fua as Jr (M-1,0) Pero Debbie. ne (M-1,N-1) 
b) ERER (MXN) b) 二 维 数组 (MXN) 
图 3-4 数字 图 像 与 矩阵 图 像 图 3-5 数字 图 像 与 二 维 数组 


3.4 图 像 文件 格式 


在 数字 图 像 处理 系 统 中 ,数字 图 像 通常 存储 在 外 部 存储 器 中 ,需要 时 再 读 出 并 进行 相应 的 
处 理 。 数 字 图 像 在 外 部 存储 器 中 的 存储 形式 是 图 像 文件 ,图 像 必须 按照 某 个 已 知 的 公认 的 数 
据 存储 顺序 和 结构 进行 存储 ,才能 使 不 同 的 程序 对 图 像 文 件 进行 打开 或 存盘 操作 ,实现 数据 共 
享 。 图 像 数据 在 文件 中 的 存储 顺序 和 结构 称 为 图 像 文件 格式 。 图 像 的 文件 格式 多 种 多 样 , 目 
前 常见 的 有 BMP、GE JPEG TIFT, PSD, DICOM, MPEG 等 。 下 面 我 们 对 这 几 种 常见 格式 进行 
详细 说 明 。 
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3.4.1 BMP 文件 格式 


位 图 文件 (Bitmap-File,BMP) 是 Windows 操作 系统 的 标准 图 像 文件 存储 格式 ,在 Windows 
环境 下 运行 的 所 有 图 像 处 理 软件 都 支持 这 种 格式 。 这 种 格式 的 图 像 在 存储 时 不 经 过 压缩 而 直 
接 按 位 存储 ,所 以 称 为 位 图 (Bitmap) 文 件 。 在 Windows 3.0 以 前 的 BMP 位 图 文件 格式 与 显示 
设备 有 关 ,因此 把 它 称 为 设备 相关 位 图 (Device-Dependent Bitmap, DDB) 文件 格式 。Windows 
3.0 以 后 的 BMP 位 图 文件 格式 与 显示 设备 无 关 , 因 此 把 这 种 BMP 位 图 文件 格式 称 为 设备 不 相 
关 位 图 ( device-independent bitmap, DIB) 文件 格式 ,目的 是 为 了 让 Windows 能 够 在 任何 类 型 的 
显示 设备 上 显示 BMP 位 图 文件 。 

BMP 文件 的 结构 分 为 四 部 分 :图 像 文件 头 、 图 像 信 息 头 、 调 色 板 、 图 像 数 据 。 下 面 对 这 四 


部 分 进行 说 明 。 
位 图 文件 头 包含 文件 类 型 文件 大 小 .存放 位 置 等 信息 ,具体 格式 如 表 3-1 所 示 。 
位 图 文件 表 3-1 





两 个 字 节 的 内 容 用 来 识别 位 图 的 类 型 ， 
“ BM’ ;Windows3. 1x,95 ,NT，… 

“BA’ :0S/2BitmapArray 

2 bytes * CI' ,08/2Colorlcon 

“ CP’ ; OS/2ColorPointer 

“IC ” :0S/2Icon 

* PT’ :OS/2Pointer 
用 一 个 字 节 表示 文件 的 大 小 
保留 ,必须 设置 为 0 

从 文件 开始 到 位 图 数据 开始 之 间 的 数据 (bitmap ) 之 间 的 偏 移 量 











文件 标识 












File Size 









Reserved 






BitmapDataOffset 


图 像 信息 头 中 包含 了 位 图 信息 头 的 长 度 、 宽 度 高度 和 位 图 的 位 面 数 ,具体 格式 如 表 3-2 
所 示 。 





位 图 信息 头 的 具体 格式 表 3-2 


位 图 信息 头 ( Bitmap Info Header) 的 长 度 , 用 来 描述 位 图 的 颜色 、 压 缩 
方法 


BitmaHeaderSize 4 bytes 











Width 位 图 的 宽度 ,以 像素 为 单位 
Height 位 图 的 高 度 ,以 像素 为 单位 
Planes 4 bytes 位 图 的 位 面 数 (该 数值 总 为 1) 
Bits/Pixel 每 个 像素 的 位 数 :1- 单 位 色 图 ;4 、16 色 位 图 ;8 ,256 色 位 图 


压缩 说 明 :0- 不 压缩 ;1-RLE8 ,使 用 8 位 RLE 压缩 方式 ; 

2-RLE4 ,使 用 4 位 RLE 压缩 方式 

Bitmap Data Size 用 字 节 数 表示 位 图 数据 的 大 小 。 该 数 必须 是 4 的 倍数 

用 像素 /m 表示 水 平分 辩 率 

用 像素 /m 表示 垂直 分 辩 率 
Colors 位 图 使 用 的 颜色 数 。 如 8. bit/ 像 素 表 示 为 100h 或 者 256 

uuu dum 指定 重要 的 颜色 数 。- 当 该 域 值 等 于 颜色 数 时 ( 或 者 等 于 0 时 ) ,表示 所 有 


颜色 都 一 样 重要 
re 


Compression 





















Hresolution 








Vresolution 
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在 这 里 将 “文件 头 ”" 和 “信息 头 ” 合 并 定义 为 一 个 结构 体 ,如 下 所 示 : 


struct | 


WORD Type ;//BMP 文件 标志 ,必须 为 BM 

DWORD Size;// 文 件 大 小 

WORD Reserved1;// 保 留 

WORD Reserved2;// 保 留 

DWORD Offset;// 图 像 数 据 对 文件 头 的 偏 移 量 

DWORD SizeStruct;//BMP 文件 头 中 一 结构 大 小 为 40 

DWORD Width;// 图 像 宽度 

DWORD Height;// 图 像 高 度 

WORD Planes;// 设 备 的 平面 数 ,为 1 

WORD BitCount;// 像 素 位 数 

DWORD Compression;// 图 像 压 缩 类 型 

DWORD SizeImage;// 图 像 数 据 大 小 

DWORD XPeIsPerMeter;// 水 平分 辨 率 。 像 素 / 米 

DWORD YPelIsPerMeter;// 垂 直 分 辨 率 。 像 素 / 米 

DWORD ClrUsed;// 使 用 了 多 少 种 颜色 ( 调 色 板 中 ) 

DWORD ClrImportant;// 重 要 颜色 的 数 

| BMPHEAD; 

调 色 板 和 图 像 数 据 。 有 些 位 图 需要 调 色 板 , 例 如 16 色 、256 色彩 色 图 ,而 有 些 位 图 不 需要 
调 色 板 ,例如 真 彩 图 。 调 色 板 包含 的 元 素 与 位 图 所 具有 的 颜色 数 相同 ,像素 的 颜色 用 RG- 
BQUAD 结构 来 定义 。 由 于 24 位 真 彩色 图 像 位 图 中 的 RGB 值 就 代表 了 每 个 像素 的 颜色 ,所 以 
不 使 用 调 色 板 。 在 调 色 板 中 ,颜色 按照 重要 性 排序 ,就 可 以 辅助 显示 驱动 程序 为 不 能 显示 足够 
多 颜色 数 的 显示 设备 显示 彩色 图 像 。RGBQUAD 结构 描述 由 R G B 相对 强度 组 成 的 颜色 , 定 
义 如 表 3-3 所 示 。 


RGBQUAD 结构 描述 表 3-3 





调 色 板 数据 


Palette N *4byte 


调 色 板 规范 。 对 于 调 色 板 中 的 每 个 表 项 ,这 4 个 字 节 用 下 述 方法 描述 RGB M: 
1 个 字 节 用 于 蓝 色 分 量 ;1 个 字 节 用 于 绿色 分 量 ; 
1 个 字 节 用 于 红色 分 量 ;1 个 字 节 用 于 填充 符 (设置 为 0) 





图 像 数 据 





Bitmap Data 





该 域 的 大 小 取决 于 压缩 方法 和 图 像 的 尺寸 ,位 深度 。 它 包含 所 有 的 位 图 数据 字 
节 , 可 能 是 彩色 调 色 板 的 索引 号 ,也 可 能 是 实际 的 RGB. 值 ,这 将 根据 图 像 信息 头 中 
的 位 深度 来 决定 





调 色 板结 构 定 义 如 下 : 


struct | 


BYTE Blue; 
BYTE Green; 
BYTE Red; 


egy e 
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BYTE Reserved;// 保 留 ,为 0 

| RGBQUAD; 

位 图 数据 紧 跟 在 彩色 表 之 后 。 图 像 的 每 一 扫描 行 由 表示 图 像 像 素 的 连续 的 字 节 组 成 ,每 
一 行 的 字 节 数 取决 于 图 像 的 颜色 数目 和 用 像素 表示 的 图 像 宽度 。 扫 描 行 是 由 下 向 上 存储 的 ， 
即 阵列 中 的 第 一 个 字 节 表示 位 图 左下 角 的 像素 ,而 最 后 一 个 字 节 表示 位 图 右上 角 的 像素 。 

需要 注意 以 下 问题 : 

(1) 在 Windows 环境 下 ,规定 BMP 文件 每 行 像素 字 节 数 必须 是 4 的 倍数 ,否则 就 要 在 像素 
数据 后 加 上 若干 字 节 (0) , 凑 足 4 的 倍数 。 

(2)24 位 文件 的 像素 数据 中 也 是 按 BLUE .CREEN , RED 的 顺序 来 排 的 。 

(3) BMP 文件 的 原点 在 左下 角 。 

(4)24 位 色 图 像 中 没有 调 色 板 数据 部 分 。 


3.4.2 GIF 文件 格式 


GIF( Graphics Interchange Format) 是 CompuServe 公司 开发 的 图 像 文件 存储 格式 。GIF 图 
像 文 件 以 数据 块 (block ) 为 单位 来 存储 图 像 的 相关 信息 。 一 个 GIF 文件 由 表示 图 形 /图 像 的 数 
据 块 数据 子 块 以 及 显示 图 形 / 图 像 的 控制 信息 块 组 成 , 称 为 GIF 数据 流 (Data Stream) 。 数 据 
流 中 的 所 有 控制 信息 块 和 数据 块 都 必须 在 文件 头 ( Header) 和 文件 结束 块 (Trailer) 之 间 。GIF 
文件 格式 采用 了 LZW( Lempel-Ziv Walch) 压缩 算法 来 存储 图 像 数据 ,定义 了 允许 用 户 为 图 像 
设置 背景 的 透明 (transparency) 属性。 此 外 ,GIF 文件 格式 可 在 一 个 文件 中 存放 多 幅 彩 色 图 形 / 
图 像 。 如 果 在 GIF 文件 中 存放 多 幅 图 像 ,它们 可 以 像 播放 幻灯 片 那样 显示 或 者 像 动画 那样 
演示 。 


3.4.3 TIFF 文件 格式 


TIFF( Tagged Image File Format) 是 相对 经 典 的 功能 很 强 的 图 像 文件 存储 格式 ,由 部 分 与 
图 像 相关 的 厂商 (Aldus、Microsoft 公司 ) 为 桌面 印刷 出 版 系统 研制 开发 的 。TIFF 文件 的 扩展 
ZH tif sk tiff, TIFF 格式 包括 一 些 常见 的 图 像 压 缩 算法 ,例如 RLE 无 损 压 缩 算法 和 LZW 无 损 
压缩 算法 等 。 

TIFF 文件 的 关键 是 标签 (tag) , TIFF 中 的 所 有 数据 都 由 一 个 标签 来 引导 ,也 就 是 说 ,所 有 
数据 都 打上 标签 ,标签 值 表示 所 引导 的 数据 类 型 。 例 如 图 像 的 大 小 ,图像 的 扫描 参数 图像 的 
作者 图像 的 说 明 以 及 图 像 数据 本 身 都 用 不 同 的 标签 作 引 导 。 

TIFF 文件 格式 的 结构 大 体 上 由 文件 头 、 图 像 文件 目录 、 目 录 表 项 和 网 像 数据 等 组 成 。 由 
F TIFF 格式 的 图 像 数 据 都 有 标签 ,使 得 TIFF 除了 文件 的 大 结构 外 ,不 需要 约定 具体 数据 的 存 
放 顺 序 。 在 读数 据 时 ,程序 只 要 先 解 释 标签 ,就 知道 后 续 的 数据 是 哪 一 个 数据 ,以 及 数据 的 长 
E, TIFF 规定 了 一 个 公共 标签 集合 ,所 有 的 图 像 处 理 程序 在 读 写 TIFF 时 都 必须 以 公共 标签 
集合 为 准 来 读 写 数 据 。 此 外 ,TIFF 还 允许 用 户 自 定义 私有 标签 ,用 来 引导 用 户 自 定义 的 数据 。 
由 于 采用 了 标签 ,使 得 TIFF 文件 灵活 性 大 为 增强 。 


3.4.4 JPEG 文件 格式 


JPEG( Joint Photographic Experts Group) 是 国际 标准 化 组 织 (ISO) 和 国际 电报 电话 咨询 委 
n e 
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员 会 (CCITT) 联 合 制 定 的 静态 图 像 压 缩编 码 标 准 。 与 相同 图 像 质量 的 其 他 常用 文件 格式 相 
IE JPEG 是 目前 静态 图 像 中 压缩 比 最 高 的 ,可 以 压缩 到 10% 以 下 , 且 几 乎 不 产生 失真 。JPEG 
格式 的 文件 广泛 用 于 存储 和 传输 静止 图 像 , 例 如 新 闻 图 片 .印刷 图 片 、 彩 色 传真 .数码 相机 等 ， 
是 目前 主流 的 文件 存储 格式 。 

JPEG 文件 由 两 部 分 组 成 :标记 码 和 压缩 数据 。 在 标记 码 中 ,部 分 记录 了 JPEG 图 像 的 所 
有 信息 ,在 每 个 标记 码 之 前 可 以 有 个 数 不 限 的 填充 字 节 0XFF。 压 缩 数 据 就 是 经 过 压缩 后 存储 
的 图 像 数 据 。JPEG 文件 的 压缩 方式 主要 采用 预测 编码 (DPCM ) 离散 余弦 变换 (DCT) EL fil 
编码 ,以 去 除 完 余 的 图 像 灰 度 和 彩色 数据 ,因而 压缩 率 极 高 。 但 需要 注意 的 是 ,JPEG 是 有 损 压 
缩 方式 ,只 是 这 种 误差 视觉 难以 察觉 而 已 。 这 种 方案 也 被 称 为 视觉 无 损 压缩 。 


3.4.5 DICOM 文件 格式 


DICOM( Digital Imaging and Communications in Medicine ) 即 医 学 图 像 文件 的 存储 格式 ,是 
由 美国 放射 学 院 (ACR) 和 国家 电气 制造 协会 (NEMA ) 在 1983 年 成 立 了 一 个 联合 委员 会 ,制定 
的 文件 格式 标准 。 

DICOM 标准 的 推出 ,大 大 简化 了 医学 影像 信息 交换 的 实现 ,推动 了 远程 放射 学 系统 、 图 像 
管理 与 通信 系统 (PACS) 的 研究 与 发 展 ,并 且 由 于 DICOM 的 开放 性 与 互联 性 ,使 得 与 其 他 医学 
应 用 系统 ( HIS RIS 等 ) 的 集成 成 为 可 能 。 

DICOM 格式 中 定义 了 数据 集 ( Data Set) ,可 用 来 保存 信息 对 象 定义 (IOD) 。 而 数据 集 又 
由 多 个 数据 元 素 (Data Element) 组 成 。 每 个 数据 元 素描 述 一 条 信息 (所 有 的 标准 数据 元 素 及 
其 对 应 信息 在 标准 的 第 六 部 分 列 出 ) , 它 由 对 应 的 标记 (8 位 16 进 制 数 , 如 (0008 ,0016) ,前 4 
位 是 组 号 ( Group Number) ,后 十 位 是 元 素 号 (Element Number) 唯一 确定 。DICOM 数据 元 素 分 
为 两 种 :标准 (Standard) 数据 元 素 ,组 号 为 偶数 ,含义 在 标准 中 已 定义 ,私有 (Private ) 数据 元 
素 , 组 号 为 奇数 ,其 描述 信息 的 内 容 由 用 户 定义 。 

此 外 ,在 DICOM 文件 格式 中 也 采用 了 与 TIFF 文件 格式 原理 类 似 的 标签 (Tag) ,所 有 的 数 
据 都 由 一 个 标签 引导 ,所 有 数据 都 打上 标签 (Tagged)。 由 于 具有 采用 数据 标签 ,支持 所 有 医学 
成 像 设 备 的 特点 ,使 得 DICOM 格式 的 文件 成 为 非常 灵活 和 复杂 的 应 用 图 像 文件 格式 。 


3.4.6 MPEG 文件 格式 


MPEG ( Moving Picture Experts Group ,动态 图 像 专家 组 ) 是 国际 标准 化 组 织 (IS0 , Interna- 
tional Standardization Organization ) 与 国际 电工 委员 会 (IEC, International Electrotechnical Com- 
mission ) 于 1988 年 成 立 的 专门 针对 运动 图 像 和 语音 压缩 制定 国际 标准 的 组 织 。 

MPEG 标准 主要 有 五 个 , 即 MPEG-1, MPEG-2, MPEG-4, MPEG-7 及 MPEG-21 等 。 该 专家 
组 建 于 1988 年 ,专门 负责 为 CD 建立 视频 和 音频 标准 ,而 成 员 都 是 视频 音频 及 系统 领域 的 技 
术 专 家 。 之 后 ,他 们 成 功 将 声音 和 影像 的 记录 脱离 了 传统 的 模拟 方式 ,建立 了 IS0/IEC11172 
压缩 编码 标准 ,并 制定 出 MPEG- 格 式 , 令 视听 传播 进入 了 数码 化 时 代 。 因 此 ,目前 所 说 的 
MPEG-X 版 本 ,就 是 由 ISO 所 制定 和 发 布 的 视频 、 音 频数 据 的 压缩 标准 。 

MPEG 标准 的 视频 压缩 编码 技术 主要 利用 了 具有 运动 补偿 的 帧 间 压 缩编 码 技术 , 以 减 小 
时 间 宛 余 度 ,利用 DCT 技术 以 减 小 图 像 的 空间 宛 余 度 ,利用 箭 编码 则 在 信息 表示 方面 减 小 了 
统计 宛 余 度 。 这 几 种 技术 的 综合 运用 ,大 大 增强 了 压缩 性 能 。 
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3.5 图 像 质量 评价 


随 着 数字 图 像 技 术 的 发 展 ,在 图 像 处 理 领 域 ,图 像 质量 评价 是 其 重要 的 分 支 ,对 图 像 工 程 
的 应 用 有 着 深远 的 意义 , 它 也 越 来 越 受 研究 人 员 的 重视 ,是 图 像 信息 学 科 的 基础 研究 之 一 。 对 
于 图 像 处 理 或 者 图 像 通信 系统 ,其 信息 的 主体 是 图 像 ,衡量 这 个 系统 的 重要 指标 就 是 图 像 的 质 
量 。 例 如 在 图 像 编码 中 ,在 保持 被 编码 图 像 一 定 质量 的 前 提 下 ,采用 尽量 少 的 码 字 来 表示 图 
像 ,以 便 节省 信道 和 存储 容量 。 而 在 增强 图 像 过 程 中 ,图 像 可 优化 的 程度 由 数字 图 像 评价 的 结 
果 来 确定 。 再 如 图 像 复 原 , 则 用 于 补偿 图 像 的 降 质 ,使 复原 后 的 图 像 尽 可 能 接近 原始 图 像 质 
量 , 这 都 要 求 有 一 个 合理 可靠 的 图 像 质量 评价 方法 ,因此 在 众多 生产 领域 中 ,图 像 质量 评价 方 
法 都 有 着 重要 的 作用 和 需求 。 

图 像 质量 直接 取决 于 成 像 装 备 的 光学 性 能 图像 对 比 度 、 仪 器 噪声 等 多 种 因素 的 影响 。 网 
像 质量 的 基本 含义 是 指 人 们 对 一 幅 图 像 视 觉 感受 的 评价 。 人 眼 作 为 图 像 的 最 终 接受 者 ,图 像 
的 好 坏 最 终 需 要 人 眼 来 评估 ,符合 人 眼 视觉 系统 的 图 像 质量 评价 方法 主要 包括 两 个 方面 ,一 个 
是 图 像 的 逼真 度 , 即 被 评价 图 像 与 原 标准 图 像 的 偏离 程度 ; 男 一 个 是 图 像 的 可 懂 度 ,是 指 图 像 
能 向 人 或 机 器 提供 信息 的 能 力 。 尽 管 最 理想 的 情况 是 能 够 找 出 图 像 副 真 度 和 图 像 可 懂 度 的 定 
量 描述 方法 ,以 作为 评价 图 像 和 设计 图 像 系统 的 依据 ,但 是 由 于 人 类 视觉 系统 的 高 度 复杂 性 ， 
图 像 质 量 评 价 一 直 都 是 十 分 困难 。 可 以 说 ,迄今 为 止 ,还 没有 一 种 权威 、 系 统 和 得 到 公认 的 评 
价 体 系 和 评价 方法 。 图 像 质 量 评 价 的 发 展 经 历 了 一 个 从 简单 的 主观 评价 到 复杂 的 客观 评价 算 
法 的 过 程 。 目 前 图 像 质量 评价 方法 中 ,从 是 否 依据 人 眼 的 主观 判断 的 角度 出 发 ,可 以 将 图 像 质 
量 评价 方法 分 为 主观 评价 方法 和 客观 评价 方法 。 前 者 是 指 观 察 者 通过 自己 的 主观 印象 给 图 像 
进行 质量 评分 ,最 终 通过 多 名 观察 者 的 平均 分 数 来 得 到 图 像 的 质量 ;而 后 者 是 指 人 不 参与 整个 
评价 过 程 ,用 客观 的 评价 指标 对 图 像 的 质量 进行 自动 评估 ,得 出 图 像 质 量 。 

3.5.1. 图 像 质量 的 主观 评价 

各 种 图 像 信息 都 是 为 人 类 服务 的 ,图 像 质量 的 好 坏 也 由 人 有 眼 判断 ,因此 图 像 质量 评价 方法 
的 最 终 目 标 是 评价 结果 与 人 的 主观 感受 相 一 致 。 人 通过 眼 畏 根据 自己 的 经 验 、 审 美观 对 图 像 
进行 主观 评价 。 图 像 的 主观 评价 就 是 以 实验 者 的 主观 感知 作为 依据 对 图 像 的 质量 进行 评价 ， 
然后 对 评分 进行 统计 平均 ,得 出 评价 的 结果 。 这 时 评价 出 的 图 像 质量 与 观察 者 的 特性 及 观察 
条 件 等 因素 有 关 。 

然而 ,主观 评价 方法 有 非常 明显 的 三 个 缺点 ; 

(1) 不 具备 实时 操作 性 ,由 于 它 是 人 为 的 参与 ,所 以 不 能 和 能 和 人 到 机 器 之 中 ,无 法 对 图 像 视 
频 系 统 进行 实时 评 佑 。 

(2) 需 要 大 量 的 人 力 物 力 ,参与 其 中 的 测试 人 员 最 好 是 经 过 训练 的 ,即便 如 此 ,人 的 行为 
会 根据 情绪 而 变化 ,人 的 观念 是 动态 变化 的 ,因此 不 具备 可 重复 性 。 

(3) 主观 评价 容易 受 周 围 环 境 所 影响 ,如 灯光 、 天 气 等 客观 因素 。 

图 像 质量 的 提高 依赖 于 图 像 采 集 、 处 理 、 显 示 等 设备 质量 的 提高 。 同 时 ,图 像 质量 的 评价 
可 以 应 用 于 对 这 些 设 备 质 量 的 间接 评估 。 但 只 有 在 当 考虑 到 系统 资源 消耗 和 外 界 条 件 限 制 及 
同样 的 软 硬 件 情况 下 ,对 设备 进行 评估 才 会 有 价值 。 而 主观 评价 不 会 因 技术 而 改变 。 从 人 的 
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角度 来 解读 一 个 图 像 的 质量 , 主要 包括 两 部 分 :第 一 ,图 像 是 否 涵盖 了 我 们 所 需要 的 信息 ;第 
二 ,是 否 满足 了 人 们 的 视觉 美感 。 这 里 所 说 的 信息 通常 被 视觉 美感 所 影响 ,比如 说 从 一 副 模糊 
的 图 像 中 根本 就 看 不 到 任何 的 信息 。 由 于 人 是 一 个 富有 情绪 的 物种 ,质量 差 的 图 像 可 能 会 给 
人 带 来 痛苦 的 感受 。 

在 对 图 像 进行 主观 评价 的 实验 中 ,样本 的 选择 最 为 重要 。 只 有 提供 的 样本 数量 足够 多 时 ， 
才 可 以 比较 稳定 、 准 确 地 对 图 像 进行 主观 质量 评价 。 如 果 样 本 的 选择 不 为 理想 ,那么 几乎 不 能 
给 予 图 像 准确 的 主观 质量 评价 。 为 保证 主观 评价 在 统计 上 有 意义 ,选择 观察 者 时 既 要 考虑 有 
未 受过 训练 的 “ 外行" 观察 者 ,又 要 考虑 有 对 图 像 技术 有 一 定 经 验 的 “内 行 观 察 者 ”。 另 外 , 参 
加 评分 的 观察 者 至 少 要 20 名 ,测试 条 件 还 应 考虑 测试 环境 中 的 亮度 .自然光 的 亮度 等 各 种 

图 像 质量 的 主观 评价 方法 又 可 分 为 两 种 评价 计 分 方法 , 即 国 际 上 通行 的 5 级 评分 的 质量 
尺度 和 妨碍 尺度 ,如 表 3-4 所 示 , 它 是 由 观察 者 根据 自己 的 经 验 , 对 被 评价 图 像 作出 质量 判断 。 
在 有 些 情 况 下 ,也 可 以 提供 一 组 标准 图 像 作为 参考 ,帮助 观察 者 对 图 像 质量 作出 合适 的 评价 。 
一 般 来 说 ,对 非 专 业 人 员 多 采用 质量 尺度 ,对 专业 人 员 则 使 用 妨碍 尺度 为 宜 。 表 3-4 中 的 质量 
尺度 是 绝对 质量 尺度 ,还 可 以 引申 出 一 些 相对 质量 尺度 标准 ,比如 ;最 好 、 偏 好 、 中 水 平 , 偏 差 、 
最 差 等 。 





两 种 尺度 图 像 的 5 级 评分 表 3-4 
R R& 得 ”分 R E 得 分 
无 觉察 5 非常 好 5 
妨碍 mm n 质量 , 
尺度 觉察 但 不 讨厌 3 尺度 般 3 
讨厌 $ 差 2 
难以 观看 1 非常 差 1 











主观 评价 方法 烦琐 、 费 时 耗 力 , 几 乎 不 可 能 自动 实现 ,因此 也 注定 了 此 类 方法 在 实际 应 用 
中 不 会 受到 广泛 运用 。 同 时 , 它 很 难 被 租 人 到 图 像 .视频 处 理 系统 中 ,如 电影 制作 、 交 通 监 控 
等 。 所 以 图 像 主观 评价 一 般 仅 作为 辅助 评价 方法 之 一 ,客观 评价 结果 与 其 进行 对 比 , 作 为 客观 
评价 方法 的 补充 。 

3.5.2. 图像 质量 的 客观 评价 

随 着 图 像 技 术 的 提升 ,在 避免 主观 质量 评价 方法 不 足 的 前 提 下 ,出现 了 一 些 具 有 优势 的 客 
观 质量 评价 方法 :不 受 测试 者 的 背景 影响 ,不 受 周 围 环境 以 及 其 他 因素 影响 ;模型 容易 建立 , 计 
算 速 度 快 ,时 间 复 杂 度 低 , 稳 定性 高 以 及 操作 简便 。 

图 像 质量 的 客观 评价 是 指 通过 使 用 图 像 的 指标 来 建立 一 个 评价 图 像 质量 的 数学 模型 , 通 
常 这 些 指标 包含 了 图 像 的 一 种 或 多 种 特征 值 。 其 目的 在 于 使 得 该 模型 对 图 像 的 客观 评 值 符合 
人 了 眼 视觉 系统 对 该 图 像 评价 的 主观 值 。 客 观 图 像 评价 方法 通常 将 测试 图 像 的 特征 值 与 原始 图 
像 的 特征 值 之 间 的 差异 作为 依据 来 判断 测试 图 像 质 量 。 依 据 对 于 原始 图 像 的 需求 程度 由 强 到 
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弱 ,客观 图 像 质量 评价 方法 有 以 下 三 类 :全 参考 图 像 质 量 评价 半 参 考 图 像 质量 评价 .无 参考 图 
像 质量 评价 。 全 参考 的 方法 需要 原始 网 像 的 全 部 信息 ; 半 参 考 则 是 指 在 对 图 像 进行 质量 评价 
的 过 程 中 ,其 中 的 一 些 过 程 需要 原始 图 像 的 部 分 信息 ;无 参考 的 方法 ,不 需要 原始 图 像 ,通过 计 
算 图 像 的 自身 特征 来 对 其 质量 进行 评价 。 

传统 图 像 质量 的 客观 评价 是 指 提出 某 个 或 某 些 定量 参数 和 指标 来 描述 图 像 质量 。 例 如 在 
图 像 压 缩 时 ,评价 质量 的 定量 参数 可 以 选用 解压 缩 图 像 对 基准 图 的 误差 参数 ,比如 常见 的 定量 
参数 是 方 均 误差 MSE 和 峰值 信 噪 比 PSNR。 


MSE = gyp? LU) -fa T (3222) 
PSNR - 10 x pum e (3-223) 


XU. MN——AY mA D RR B5 128080 R ; 
f(x,y) (xy) 一 一 分 别 为 原始 图 像 和 解压 缩 重建 的 图 像 ; 
fa 、fs 一 一 分 别 对 应 图 像 灰 度 的 最 大 值 和 最 小 值 。 

这 两 种 算法 的 核心 思想 是 通过 对 比 测试 图 像 与 原始 图 像 之 间 的 差异 ,计算 出 所 有 像素 点 
之 间 的 差 值 , 先 求 出 其 评分 差 , 然 后 求 和 。MSE 的 值 越 小 , 则 说 明 该 图 像 的 质量 越 好 ;PSNR 则 
相反 。 由 于 这 两 种 算法 都 需要 原始 图 像 的 全 部 信息 ,所 以 这 两 种 方法 是 全 局 的 质量 评价 方法 。 
另外 ,这 两 种 方法 是 基于 像素 的 ,并 没有 考虑 到 图 像 的 整体 性 ,所 以 这 两 种 方法 通常 只 是 网 像 
质量 评价 的 基础 ,或 者 说 只 是 一 个 参照 标准 。 

图 像 质量 客观 评价 的 男 一 种 方法 是 采用 测试 卡 。 在 测定 电视 的 显示 质量 、 数 码 相机 和 扫 
描 仪 的 成 像 质 量 时 ,常用 不 同 的 标准 测试 卡 来 完成 。 例 如 在 测定 数码 相机 的 分 辩 率 时 ,通常 用 
专业 的 标准 分 辩 率 测试 卡 进行 照相 ,然后 利用 配套 软件 对 测试 卡 图 像 进行 观察 和 计算 ,可 以 测 
出 数码 相机 分 辨 率 ( 线 数 ) 。 

客观 评价 的 特点 是 采用 客观 指标 和 定量 指标 ,操作 简单 ,费用 低 ,速度 快 ,适用 范围 广 ， 
评价 结果 容易 解析 并 嵌入 到 实验 当中 ,评价 结果 原则 上 不 受 人 为 干预 和 影响 。 但 是 ,由 
于 目前 的 定量 参数 还 不 能 或 者 不 完全 能 反映 人 类 视觉 的 本 质 , 对 图 像 质量 的 客观 评价 指 
标 经 常 与 视觉 的 评价 有 偏差 ,甚至 有 时 结论 完全 相反 。 各 种 图 像 信 息 都 是 为 人 类 服务 
的 ,图像 质量 的 好 坏 也 由 人 有 眼 判断 ,因此 图 像 质量 评价 方法 的 最 终 目 标 是 评价 结果 与 人 
的 主观 感受 相 一 致 。 

目前 ,在 国际 电信 联盟 的 视频 质量 专家 组 ( VQEG , Video Quality Experts Group ) 的 研究 建 
议 下 ,认为 一 个 好 的 客观 质量 评价 方法 在 与 主观 评价 方法 结合 时 应 满足 以 下 条 件 : 

(1) 评 价 结果 要 具备 准确 性 , 客 评价 值 不 能 偏离 主观 值 太 多 。 

(2) 算 法 要 具有 单调 性 ,评价 的 结果 会 随 着 主观 评价 值 的 增加 而 增加 ,或 者 随 之 
减 小 。 

(3) 良 好 的 评价 模型 要 具备 一 致 性 ,评价 的 结果 要 够 给 不 同 内 容 的 图 像 合理 的 质量 评价 ， 
评价 的 准确 性 不 会 因 内 容 的 改变 而 改变 ,评价 值 只 会 与 图 像 的 质量 值 保持 一 致 。 

pm ea. 
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3.6 图 像 噪声 


噪声 可 以 理解 为 妨碍 人 们 对 所 接收 信息 理解 的 因素 。 现 实生 活 中 ,由 于 成 像 设备 和 外 界 
环境 的 影响 ,图像 在 采集 传输 和 管理 过 程 中 常常 受到 噪声 的 干扰 。 图 像 一 旦 受到 污染 ,进行 
处 理 的 图 像 不 再 是 原始 图 像 ,而 是 降 质 的 噪声 图 像 。 这 种 噪声 图 像 降低 了 人 类 视觉 或 传感器 
理解 分 析 的 能 力 ,对 图 像 分 割 ,图像 压 缩 .识别 等 后 续 处 理 影响 很 大 。 对 于 一 副 灰 度 图 像 ,经 
数字 化 后 可 用 一 个 m xn 大 小 的 二 维 函 数 /(x,y) 表示, 其 中 , (x,y) 表示 像素 在 原 图 中 的 
坐标 ,f(x,y) 表示 该 坐标 像素 的 灰 度 值 ,其 中 ,x、y 和 幅 值 是 离散 的 。 那 么 图 像 中 干扰 
因素 的 亮度 分 布 可 表示 为 R(x,y) , 即 可 称 为 图 像 噪声 。 活 动 的 黑白 电视 图 像 噪声 可 以 
表示 为 R(x,y,t) ,彩色 电视 图 像 品 声 可 以 表示 为 R(x,y,i, 和 A)。 但 是 ,噪声 在 理论 上 可 以 
定义 为 “不 可 预测 ,只 能 用 概率 统计 方法 来 认识 的 随机 误差 ” ,因此 将 图 像 噪声 看 成 是 多 
维 随机 过 程 是 合适 的 ,因而 描述 噪声 的 方法 完全 可 以 借用 随机 过 程 的 描述 , 即 用 其 概率 
分 布 聘 数 和 概率 密度 分 布 函 数 。 但 在 很 多 情况 下 ,这 样 描述 是 很 复杂 ,甚至 不 可 能 的 ,而 且 
往往 也 没 必要 。 通 常 使 用 其 数值 特征 , 即 均值 方差 .相关 函数 等 ,因为 这 些 数值 特征 都 可 以 从 
某 些 方面 反映 出 噪声 的 特征 。 

噪声 主要 来 源 于 图 像 数字 化 过 程 中 的 采集 ,传输 .管理 阶段 ,如 图 3-6 所 示 。 





图 3-6 图 像 噪声 的 产生 环节 


(1) 图 像 信息 采集 阶段 :在 图 像 采 集 阶段 ,系统 传感器 的 状态 受 元 件 质量 、 工 作 环境 等 因 
素 的 影响 。 这 个 阶段 的 噪声 主要 为 椒盐 噪声 和 双 极 性 噪声 。 

(2) 图 像 信息 传输 阶段 :在 图 像 传 输 阶 段 ,传输 信道 被 干扰 产生 噪声 。 这 个 阶段 常见 的 品 
声 有 双 极 性 噪声 和 高 斯 噪声 。 

(3) 图 像 信息 管理 阶段 :图 像 管 理 包括 储存 删除、 复制 等 。 管 理 系 统 中 由 于 元 器 件 老化 、 
电路 自 激 滤波 不 良 等 原因 产生 电阻 热 噪声 . 堆 弹 噪声 以 及 1 噪声 。 

目前 大 多 数 数字 图 像 系统 中 ,输入 光 图 像 都 是 采用 先 冻结 再 扫描 方式 将 多 维 图 像 变 成 为 
电信 号 ,再 对 其 进行 处 理 、 存 储 、 传 输 等 加 工 变换 ,最 后 往往 还 要 再 组 成 多 维 图 像 信号 。 而 图 像 
噪声 也 同样 受到 这 样 的 分 解 和 合成 ,在 这 些 过 程 中 ,电气 系统 和 外 界 影响 将 使 得 图 像 噪声 的 精 
确 分 析 变 得 十 分 复杂 。 男 一 方面 ,图 像 只 是 传输 视觉 信息 的 媒介 ,对 图 像 信 息 的 认识 理解 是 由 
人 的 视觉 系统 所 决定 的 。 不 同 的 图 像 噪声 ,不 同 的 人 感觉 (理解 ) 程度 是 不 同 的 ,这 就 是 所 谓 
的 人 的 噪声 视觉 特性 课题 。 所 以 现在 还 不 能 规定 出 确切 的 图 像 噪声 干扰 的 客观 指标 , 而 只 能 
进行 一 些 主观 评价 研究 。 尽 管 如 此 ,图像 噪声 在 数字 图 像 处 理 技 术 中 的 重要 性 已 愈加 明显 ,如 
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高 放大 倍数 航 片 的 判读 ,X 射线 图 像 系 统 中 的 噪声 去 除 等 都 已 成 为 不 可 缺少 的 技术 。 另 外 ,其 
在 图 像 系统 的 空间 频率 特性 的 某 些 性 能 测试 图像 信 息 的 伪装 以 及 全 息 技 术 中 都 有 一 定 的 
应 用 。 

噪声 对 图 像 信号 幅度 和 相位 的 影响 十 分 复杂 ,有 些 噪 声 和 图 像 信 号 相互 独立 不 相关 ,有 
些 是 相关 的 ,噪声 本 身 之 间 也 可 能 相关 。 因 此 要 减少 图 像 中 的 噪声 ,必须 针对 具体 情况 采用 不 
同方 法 ,否则 很 难 获得 满意 的 处 理 效果 。 

一 般 图 像 处 理 中 常见 的 噪声 有 ; 

(1) 加 性 噪声 

加 性 噪声 和 图 像 信号 强度 是 不 相关 的 。 如 图 像 在 传输 过 程 中 引进 的 “信道 噪声 ”, 电 
视 摄像 机 扫描 图 像 的 噪声 ,这 类 带 有 噪声 的 图 像 g 可 视 为 理想 无 噪声 图 像 /与 噪声 "之 
和 , 即 


pgzftn (324) 


(2) 乘 性 噪声 
乘 性 噪声 和 图 像 信号 是 相关 的 ,往往 随 图 像 信号 的 变化 而 变化 ,如 飞 点 扫描 图 像 中 的 噪 
声 、 电 视 扫描 光栅 、 胶 片 颗粒 造成 的 噪声 等 ,这 类 噪声 和 图 像 的 关系 是 : 


g=f+fn (3-25) 


(3) 量 化 噪声 

量化 噪声 是 数字 图 像 的 主要 噪声 源 , 其 大 小 显示 出 数字 图 像 和 原始 图 像 的 差异 ,减少 这 种 
噪声 的 最 好 办 法 就 是 采用 按 灰 度 级 概率 密度 函数 选择 量化 级 的 最 优 量 化 措施 。 

(4) 椒 盐 噪 声 


人 的 误差 ,使 图 像 反 变换 后 造成 的 变换 噪声 等 。 

图 像 去 噪 的 目的 就 是 为 了 减少 图 像 噪声 。 图 像 噪声 来 自 于 多 方面 ,有 的 来 自 于 系统 外 部 
干扰 ,如 电磁 波 和 经 电源 串 进 系统 内 部 而 引起 的 外 部 噪声 ;也 有 来 自 于 系统 内 部 的 干扰 ,如 摄 
像 机 的 热 噪 声 , 电 器 机 械 运动 而 产生 的 抖动 噪声 等 内 部 噪声 。 

减少 噪声 的 方法 可 以 在 图 像 空间 域 或 在 图 像 变换 域 完成 。 

(1) 图 像 空 间 域 去 噪 方法 是 在 局 部 空间 域 以 图 像 的 模糊 为 代价 来 换取 噪声 的 减少 。 

(2) 图 像 变换 域 去 噪 方法 是 对 图 像 进 行 某 种 变换 ,将 图 像 从 空间 域 转换 到 变换 域 ,再 对 变 
换 域 中 的 变换 系数 进行 处 理 , 然 后 进行 反 变换 ,将 图 像 从 变换 域 转换 到 空间 域 , 来 达到 去 除 图 
像 噪声 的 目的 。 

后 续 章 节 将 针对 以 上 方法 详细 阐述 。 


3.7 ”本 章 小 结 


图 像 数 字 化 是 数字 图 像 处 理 的 基础 。 本 章 介绍 了 图 像 的 数字 化 过 程 ,分 类 描述 了 图 像 数 
据 结构 和 文件 格式 ,同时 对 图 像 的 主观 和 客观 评价 方法 进行 了 详细 分 析 。 
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1. 简 述 图 像 数字 化 的 过 程 。 

2. 常见 的 颜色 空间 有 哪些 ? 

3. 采样 定理 对 模拟 图 像 数字 化 的 要 求 有 哪些 ? 

4. 常 见 的 数字 图 像 有 哪些 格式 ?如 何 评价 图 像 质量 ? 


4.1 前 言 


图 像 变换 是 指 将 图 像 变换 到 其 他 空间 ,进而 在 其 他 空间 对 图 像 进行 处 理 的 过 程 , 是 
许多 图 像 预 处 理 方法 的 重要 基础 。 合 理 地 使 用 图 像 变换 ,能够 便于 处 理 图 像 中 的 特定 信 
息 ,使 图 像 满足 需求 。 这 种 利用 变换 后 的 空间 来 处 理 图 像 的 方法 称 为 基于 变换 域 的 方 
法 ,其 中 最 常用 的 变换 空间 是 频 域 空间 。 频 域 空间 反映 的 是 图 像 中 所 有 像素 在 频 域 的 性 
质 , 具 有 全 局 性 ,因而 在 频 域 处 理 图 像 能 够 更 好 地 体现 图 像 整体 的 特性 。 图 像 变换 从 空 
间 域 变换 到 频 域 的 方法 有 很 多 ,最 常见 的 是 线性 正 交 变换 , 主要 分 为 正弦 类 变换 和 非 正 
弦 类 变换 两 大 类 。 本 章 从 这 两 大 类 别 ,以 传 立 叶 变换 、 余 弦 变 换 、 沃 尔 什 和 哈达 玛 变换 为 
例 ,对 常见 的 图 像 变 换 方法 进行 详细 阅 述 。 


4.2 傅立叶 变换 


1822 年 ,法国 数 学 家 傅立叶 (Fourier) 18 ih , E fa] AHRR At) 都 可 以 由 多 个 不 同 频率 及 
系数 的 正弦 和 /或 余弦 和 的 形式 来 表示 。 其 至 是 非 周 期 函数 ,在 该 曲线 面积 是 有 限 的 情况 下 ， 
也 可 以 用 正弦 和 /或 余弦 和 乘 以 加 权 的 积分 来 表示 。 将 周期 函数 (4) 分解 为 无 穷 多 个 不 同 频 
率 正弦 信号 的 和 , 即 傅立叶 级 数 。 求 解 傅立叶 级 数 的 过 程 就 是 传 立 叶 变 换 。 傅 立 叶 变换 实际 
上 是 将 信号 与 一 组 f(1) 不 同 频率 的 复 正 弦 做 内 积 ,这 一 组 复 正弦 是 变换 的 基 向 量 , 健 立 叶 系数 
或 侍 立 叶 变 换 是 f(1) 在 这 一 组 基 向 量 上 的 投影 。 用 傅立叶 级 数 或 变换 表示 的 函数 的 特征 可 以 
通过 傅立叶 反 变 换 来 重建 ,而 且 该 过 程 具 有 不 会 丢失 任何 信息 的 优点 。 

在 图 像 处 理 技术 的 发 展 过 程 中 ,傅立叶 变换 起 着 十 分 重要 的 作用 。 传 立 叶 变换 是 线性 系 
统 分 析 的 一 个 有 力 工 具 , 它 能 够 定量 地 分 析 信 号 特征 。 把 傅立叶 变换 的 理论 与 物理 解释 相 结 
合 ,将 有 利于 解决 大 多 数 图 像 处 理 问 题 。 传 立 叶 变 换 在 图 像 处 理 中 的 应 用 十 分 广泛 ,如 图 像 特 
征 提取 频率 域 滤波 图像 复 原 、 纹 理 分 析 等 。 

4.2.1 图 像 一 维 傅立叶 变换 的 基本 概念 

傅立叶 变换 在 数学 中 的 定义 是 非常 严格 的 , 它 的 定义 如 下 : 

设 x 为 f(x) 的 函数 ,如 果 f(x) 满 足下 面 的 狄 里 赫 莱 条 件 : 

(1) 具 有 有 限 个 间隔 点 ; 

(2) 具 有 有 限 个 极点 ; 

(3) 绝 对 可 积 。 

AN ER 
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则 定义 x) 的 伟 立 叶 变 换 公式 为 ; 


Flu) = | Ka)? da (41) 
VM BUB ASCN 
f(x) = | Poem (4-2) 
其 中 ,x 为 时 域 变量 ; 为 频 域 变量 。 如 果 再 令 oo = 2mp, M ERRAIN R: 
Flw) = { feeds (4:3) 
Ka) = 人 Füne" ds = 元 | Fue" do (4-4) 


由 上 面 公式 可 以 看 出 ,傅立叶 变换 结果 是 一 个 复数 表达 式 。 设 F(u) 的 实 部 为 R(w), 虚 
WA Iw), M]: 


Flw) = R(w) *jl(o) (4-5) 
或 者 写成 指数 形式 
Flw) =| F(o) | e*? (4-6) 
其 中 : 
| F(o) | = VR læ) +Po) (4-7) 
I(w) 





(4-8) 


中 (ww) = arctan 


R(o) 
通常 称 1F(w) | 为 f(x) 的 傅立叶 幅度 谱 ,$(w) 为 f(x) 的 相位 谱 。 傅立叶 变换 也 可 以 推广 
到 二 维 情况 。 如 果 二 维 函 数 f(x,y) 满 足 狄 里 赫 莱 条 件 , 那 么 它 的 二 维 傅立叶 变换 为 ; 


Fluo) = | [U Kay)? dudo (4-9) 
f(x,y) = E i F(u,v)e dxdy (4-10) 

同样 ,二 维 傅立叶 变换 的 幅度 谱 和 相位 谱 为 : 
| F(p v) | S VR (u,v) + P (u,v) (4-11) 

= aretan TA?) : 
(u,v) = arcta Rari (4-12) 
可 以 定义 : 

E(u,v) = R'(u,v) + P(u,v) (4-13) 


通常 称 Elu, w) 为 能 量 谱 。 
4.2.2 图 像 二 维 离散 傅立叶 变换 
为 了 在 数字 图 像 处 理 中 应 用 传 立 叶 变换 ,必须 引入 离散 傅立叶 变换 (DFT, Discrete Fourier 
Transform) 的 概念 。 它 的 数学 定义 如 下 : 
如 果 f(x) 为 一 个 长 度 为 N 的 数字 序列 , 则 其 离散 傅立叶 变换 Fu) 为 : 
F(p) = SUG)] = XfG)e* (4-14) 
EN 
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离散 傅立叶 反 变换 为 ; 

Ka) = SITEP(UOD] = EAF (4-15) 
其 中 ,x=0,1,2,…,N -1。 
WRG W =e7 ,那么 上 述 公式 变 成 ; 


F(u) = 3UG)] = Eflx)e = s (4-16) 
Ka) = FFP)] = EEr = EF) (4417) 
式 (4-16 ) 写成 矩阵 形式 为 : 
F(0) 更 » ww wo f0) 
KD L|w ww e w^ DD | a 
F(N - 1) y^ yeo pon A pon 1) x(N-1) fU -1) 
式 (4-17 ) 写成 矩阵 形式 为 : 
fO) wow WU ve LA F(0) 
fq) al v y di des Lenis Fe (4-19) 
JN. PE. 1) y^ — — ew g-a- F(N 23 1) 
同 理 ,二 维 离散 函数 /(%,y) 的 傅立叶 变换 为 ; 
Flp) = SUG.)] = E Efe D (4-20) 
傅立叶 反 变换 为 ， 
Kay) = SITFUe)] = dio E Y Fo) G9 (421) 


其 中 ,x =0,1,2,…,M-1;y=0,1,2,…,N-1。 
在 数字 图 像 处 理 中 ,图 像 取样 一 般 是 方 阵 , 即 M=NN, 则 二 维 离散 傅立叶 变换 公式 为 : 


Fu») = S[fG,)] = 2 Y fG,y)e? 692 (4-22) 
Ray) = FP] = EE Y F(a v) P7 692 (423) 


4.2.3 ”图像 二 维 离散 傅立叶 变换 的 性 质 
离散 传 立 叶 变 换 和 连续 傅立叶 变换 的 性 质 相 似 , 图 像 二 维 离散 傅立叶 变换 的 很 多 重要 性 


质 ,为 运算 处 理 提供 了 方便 。 下 面 将 介绍 一 些 重要 的 二 维 离散 傅立叶 变换 的 重要 性 质 。 


1. 可 分 性 
观察 式 (4-22) 和 式 (4-23) 可 以 发 现 , 二 维 离散 傅立叶 正 反 变 换 的 指数 项 可 以 分 为 只 含 


x 和 vw,y 的 两 项 的 积 ,也 就 是 说 ,一 个 二 维 离散 傅立叶 变换 可 以 通过 先后 两 次 运用 一 维 傅立叶 
变换 来 实现 , 即 先 沿 f Cx y) 的 列 方向 求 一 维 离散 傅立叶 变换 得 到 (x,v) ,再 对 F(x v) RETI 
方向 求 一 维 离 散 傅立叶 变换 得 到 Fu v) : 
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ROSS (4-24) 
这 个 过 程 可 以 用 图 4-1 表示 。 
(0, 0) N-1 y (0, 0) N-1 y (0, 0) N-1 
f, y) DEN FG, v) PER F(x, v) 
N-1 N-1 N-1 
x x u 


图 4-1 二 维 离散 傅立叶 变换 的 分 离 过 程 
二 维 离散 傅立叶 反 变 换 的 分 离 过 程 与 正 变 换 的 分 离 过 程 相 似 。 


2. 平移 性 
离散 傅立叶 变换 的 平移 特性 如 下 : 
ILa -toy 731 = Feu, e GR) (4-25) 
SLf(x y) ER) = F(u - n,» - 9) (4-26) 


3k (4-25) 与 式 (4-26) 表 明 , 如 果 在 空间 域 中 图 像 平 移 到 点 (x sys ) AÈ , DUEBOSEIZ DHL S 
变换 要 乘 上 一 个 系数 e- 产 (学 : 吕 ), 即 表明 空间 域 中 图 像 的 平移 对 应 于 频 域 中 的 相 移 ,其 傅 立 
叶 的 幅 值 不 变 (因为 e-?"( 凶 :并 的 幅 值 为 1)。 

在 数字 图 像 处 理 中 ,通常 将 傅立叶 变换 频 域 谱 的 原点 移动 到 矩阵 M x IN 的 中 心 ,以 便 能 清 
楚 地 分 析 傅立叶 变换 谱 的 情况 。 假 设 


.M 
Mo = 9 
i cdi 
En 
则 d UE) = umen =( get. 
H3X (4-26) 可 得 : 
UG )(- 01 = F(a- 5-2) (4-27) 


式 (4-27) 表明 ,如 果 要 将 图 像 的 频谱 原点 移动 到 图 像 中 心 ,只 要 将 f(x,y) 乘 上 因子 
( -1) 再 进行 离散 傅立叶 变换 即 可 。 图 4-2 为 图 像 频 谱 移动 示意 图 。 
3. 周期 性 


离散 傅立叶 变换 具有 周期 性 : 
F(u,v) = F(u * aN,v +bN) (4-28) 


— B 2 


f(x,y) = f(x * aN,y * bN) (4-29) 
Hi ,a,b20, £1, 2,3, 


ft 


离散 传 立 叶 变 换 的 周期 性 说 明 离散 函数 C, y) 经 过 正 变换 后 得 到 的 F(u,v) [3X3 F(p v) 
通过 反 变 换 得 到 的 f(x,y) ] 都 是 以 V 为 周期 的 离散 函数 





b) 无 平移 的 傅立叶 频谱 o) 平 移 后 的 傅立叶 频谱 
图 4-2 图 像 频 谱 移动 示意 图 


4. A Abk 
如 果 离 散 函 数 Kx ,y) 的 傅立叶 变换 为 F* ( -u, -v) Hf x, - y) BUS vr n AETM SE 
Hf PRA, JI ZA 
F(u,v) = F'(-p, -v) (4-30) 
| F(u,v) | =| F(-p, -v) | (4-31) 


BS HALBE BR P5] Hc PE LE] RRR f(x, y ) £e ETE AE f 8 38H] F uc v) A VAR LO 
HbSEERBS, HAEE, EUER HE 58] LAT BA (EUSC nT DLE EI F3 BS I 

5. 旋转 特性 

如 果 空 间 域 离散 函数 旋转 角度 为 0, , 则 在 变换 域 中 该 离散 函数 的 离散 傅立叶 变换 函数 也 
将 旋转 同样 的 角度 。 其 数学 表达 式 如 下 ; 


S[f(r, -6,)] = F(k, + 6) (4-32) 
离散 傅立叶 变换 的 旋转 特性 如 图 4-3 和 图 4-4 所 示 





图 4.3 ”原始 图 像 及 其 傅立叶 频谱 





图 4-4 


旋转 45° 后 的 图 像 


及 其 傅立叶 频谱 


6. 对 称 性 


如 果 离 散 函 数 Kx,y) 的 离散 傅立叶 变换 为 Fu uv) 


S| F(x,y)|  MN*f(-p, —-v) 


,那么 : 


IIR: BS RC PIE f(x, y ) B] ES EIC HE AEDR Fu v) 


S| af( x x) = aF(p,v) 
«5 fl ax ,By JA ms F(£-,- | 





随 着 计算 机 技术 和 类 电路 的 迅速 
处 理 的 一 种 重要 的 手段 。 然 而 ,离散 傅立叶 变换 计算 量 太 大 ,运算 时 间 过 长 ， 
其 应 用 。 按 照 式 ( 4-14) 计算 -个 长 度 为 N 的 - 
数 乘法 和 (CN-1) 次 复数 加 法 。 那 么 ,对 V 个 人 人 , 则 需要 N 
很 显然 , 当 wV 很 大 时 ,计算 量 是 十 分 巨大 的 
首先 提出 一 种 快速 傅立叶 好 
复数 乘法 和 加 法 次 数 正比 于 Mog, N, 


发 展 ,离散 傅立叶 变换 已 


V 次 复 

1965 AE A 库 里 ( Cooly ) FE A] AE ( Tukey ) 
算法 进行 离散 傅立叶 变换 ，,: 
大 减少 ,如 表 4-1 所 示 





经 成 为 数字 信和 号 
在 某 种 程度 
- 维 离散 傅立叶 变换 ,对 内 的 每 - 
?次 复数 乘法 和 N(N -1) 


变换 (FFT ) 
这 在 N 很 大 时 计算 量 n 大 


„a 和 局 为 两 个 标量 ,那么 : 


(4-33) 


F Ab EA LR 
& LB TE 
“个 信 H 需要 p 做 


Bi, 


=N 


用 该 


























FFT 算法 与 普通 傅立叶 变换 算法 的 对 比 K 4-1 
N | (普通 FT) Vlog; N( FFT) N/lo 
一 x T 
2 4 2 2.0 
E 4 16 8 I 2.0 
i Nu" 64 24 | 2.7 
16 256 64 4.0 
32 1024 160 6.4 
ur 64 | 096 E E 384 E jë 10.7 
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续 上 表 


N A 和 (普通 FT) Nlog, N( FFT) N/log, N 
128 16384 896 18.3 
256 65536 2048 32.0 


512 262144 4608 56.9 











1024 1048576 10240 102.4 


由 表 4-1 可 见 ,采用 FFT 可 以 减少 运算 量 ,图 像 越 大 ,减少 的 运算 量 越 多 。 对 于 长 为 1024 
的 离散 序列 ,用 普通 的 离散 傅立叶 变换 往往 要 计算 几 十 分 钟 ,而 采用 FET 则 只 要 几 十 秒 。 

快速 傅立叶 变换 不 是 一 种 新 的 变换 , 它 只 是 离散 傅立叶 变换 的 一 种 改进 算法 。 它 分 析 了 
离散 傅立叶 变换 中 重复 的 计算 量 ,并 尽 最 大 的 可 能 使 之 减少 ,从 而 达到 快速 计算 的 目的 。 由 于 
二 维 离 散 傅立叶 变换 可 以 分 离 成 一 维 离散 傅立叶 变换 来 实现 ,因此 这 里 只 介绍 一 维 离 散 侍 立 
叶 变换 的 快速 算法 。 

对 N 点 序列 f(n) ,其 一 维 离散 傅立叶 变换 的 定义 为 : 





1 Wal m ’ 
Fin) = WN 0 NW 


(4-36) 
Hired a 
令 矩 阵 
所 oye v 
y? Ww! W? nd w^ 
W,s[IW"l-|w W wt o paa (437) 
y^ y^ go pono 
TUI — Hirt R rr RT DURER Pede (4-38 ) 来 表示 。 
F(0) wow WW o w° f0) 
F(1) wow uw uu aee fa) 
FQ) ||W w  w e we» | 2) (438) 
F(N - 1 ) - - gon 2 giao F(N , 1 ) 


观察 系数 矩阵 式 (4-37 ) ,并 结合 W 的 定义 表达 式 W - e^ , URRAS W"*" 以 NN 为 周 
期 。 这 样 ,系数 矩 阵 中 有 很 多 系数 是 相同 的 ,不 必 进 行 多 次 运算 。 而 且 由 于 W 264? --1, 
因此 yn = We x WII Wr", 即 W"** 又 具有 对 称 性 ,因而 利用 W"* 的 对 称 性 可 以 进 一 
步 减少 计算 量 。 

例如 ,对 于 NV =4, 系 数 和 矩阵 为 

eq Ue 
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wow w w 
Ww ww" py" r 
Ww w w w 
由 Wwe AARET pf: w* ww WwW, W =W; h F W^" SOGERR PERI DL B. 
W --W,Wz-W., A, RUER EUREN: 
ww ww y? y 
p y* -wp -w 
WoW". y 
py -p -P wy 
可 见 ,系数 矩阵 中 元 素 重 复 是 很 多 的 ,如 果 把 序列 分 解 成 若干 短 序列 ,并 与 系数 矩阵 元 素 
巧妙 地 结合 起 来 计算 离散 傅立叶 变换 ,可 以 简化 运算 ,这 就 是 FFT 的 基本 思路 。 
设 V=224(B 为 整数 ) ,下 面 按照 奇偶 来 将 序列 x(n) 进 行 划 分 , 设 
I = x(2n) 
h(n) = x(2n +1) 


其 中 (n=0,1,2,3,…… A2) 因此 离散 傅立叶 变换 可 以 改写 成 下 面 的 形式 ， 


X(m) = Ex(n) -W. 


Na Na 


2 


-Eg(n): Wy + Eh(n)- 
K 0m 2 Wann 


> Wp + +1) Wr 
=G(m) + Wy H(m) (4-39) 
因此 ,一 个 求 W 点 的 DFT NOMURRI -R s DFT, DAN -8 的 DFT 为 例 ,利用 
式 (4-39) 可 得 : 
X(0) 2 G(0) + W? * H(0) 
X(1) = G(1) +W} - H(1) 
X(2) = 6(2) «Wi - H(2) 
X(3) = G(3) + W - H(3) 
X(4) = G(4) + W; - H(4) 
X(S) = CS) 4 W; H5) 
X(6) = G(6) + W$ - H(6) 
X(7) 2 G(7) - W; - H(7) 


(4-40) 





e aqq. 
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由 于 Gl(m) 和 8H(m) 都 是 4 点 的 DFT, 所 以 它们 均 以 4 为 周期 。 因 此 G(m +4) =G(m)， 
H(m+4) 2H(m), Bill E Wz 的 对 称 性 ,要 ”= 一 更 (m=0,1,2,3) ,因此 式 (4-40) 可 以 写 为 ， 


X(0) = G(0) + W° - H(0) 
X(1) 2 G(1) & Wl - H(1) 
X(2) = C) -W2-H(2) 
X(3) = G(3) + Ws - H(3) (4-41) 
X(4) = G(0) + W° - H(0) 
X(5) = G(1) + Wl - H(1) 
X(6) = G(2) + W - H(2) 
X(7) = G(3) + Wi - H(3) 
如 图 4-5 所 示 , 定 义 由 G(1)、H(1)、X(1) 和 XX(5) 所 构成 的 Ga) X(1) 
结构 为 蝶 形 运算 , 它 的 左 方 两 个 节点 为 输入 节点 ,代表 输入 数值 ; ; 
右 方 两 个 节点 为 输出 节点 ,表示 输入 数值 的 释 加 。 运 算 由 左 向 右 ui 
进行 , 线 旁 的 本 和 - 现 为 加 权 系 数 。 
图 4-5 表示 的 运算 为 : 
X(1) = G(1) + Vi - H(1) 
X(5) = G(1) - W; - H(1) HQ) yi XG) 
"dn RI H(m) E 4 点 的 DET, 如果 对 它们 再 按照 奇偶 进行 aas ERNS 
人 = g(2n) (n 2 0,1,2,3,, S. -1) 
bln) = g(2n + 1) 


EM = h(2n) 
d(n) = h(2n +1) 
这 样 , 式 (4-41) 就 可 以 用 蝶 形 运算 单元 来 表示 ,如 图 4-6 所 示 。 


N 
(a= 0,1,2,3, ”4 -1) 


= 


x(0 
1 


— 


x( 


xQ 
x 


= 


(3) 


x(4) 
x(5) 
x(6) 
x(7) 








Kd4-o ” 蝶 形 运算 单元 
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Wi : 
G(m) = Satu 
Pone wx" * San +1). Li de 
= Dal(n) Y vy «Es OWY Wi 
-A(m) + W? - B(m) (4-42) 
E, 
H(m) = C(m) + WT - D(m) (4-43) 
因 设 28,8 A(m) ,B(m) .C(m) 和 D(m) 都 是 两 点 的 DFT, C15 G(m) Fl H(m) 的 关 
系 为 : 
G(0) = A(0) + W - B(0) 
G(1) = A(1) + W - B(1) 
G(2) = A(0) - W; - B(2) 
G(3) = A(1) =  - B(3) 
H(0) = C(0) + W? - D(0) 
H(1) = C(1) + W- D(1) 
H(2) = C(0) - WW - D(2) 
H(3) = C(1) - W D(3) 
至 此 ,4A(m)、B8(m)、C(m) 和 D(m) 都 是 两 点 的 DFT, 它 们 可 以 由 原始 数据 x(n) 直接 求 
出 。 计 算 公 式 如 下 : 
ei = x(0) + Ws * x(4) 
A(1) = x(0) - W; * x(4) 
b =x(2) -Wi-*x(6) 
B(1) = x(2) - W; * x(6) 
a = x(1) + Ws -+ x(5) 
C(1) = x(1) - W; * x(5) 
Ais = x(3) -W)-x(7) 
D(1) = x(3) - Wl - x(7) 
综 上 所 述 ,8 点 DET 的 完整 蝶 形 逐 级 分 解 框 图 如 图 4-7 所 示 。 
由 图 4-7 可 见 , 蝶 形 流程 图 的 输出 序列 XX(m) 是 按照 m 从 小 到 大 的 顺序 排列 的 ,而 输入 序 
列 x(n) 不 是 按 从 小 到 大 的 顺序 ,而 是 按照 码 位 倒序 而 排列 的 。 
如 果 把 自然 顺序 的 十 进 制 数 转 换 成 二 进 制 数 ,然后 将 这 些 二 进 制 的 首 末 位 倒序 再 重新 转 
换 成 十 进 制 数 , 那 么 这 时 的 十 进 制 数 的 排列 就 是 码 位 倒序 排列 。N =8 的 自然 顺序 与 码 位 倒序 
的 比较 如 表 4-2 所 示 。 
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图 4-7 8 点 DFT 逐 级 分 解 运算 框图 





自然 顺序 与 码 位 倒序 (N=8) i42 
十 进 制 数 码 位 倒序 后 的 十 进 制 数 
0 000 000 0 
2 010 010 2 
: 
4 100 001 1 





码 位 倒序 的 排列 规律 是 由 FFT 算法 所 决定 的 ,如 果 输 入 要 求 按照 自然 顺序 排列 , 则 输出 
就 必然 为 码 位 倒序 排列 。 

以 上 介绍 的 FFT 算法 是 把 时 间 序 列 x(n) 按 照 n 的 奇偶 进行 分 组 计算 的 ,又 称 为 按时 间 分 
组 的 FFT 算法 。 如 果 将 频率 序列 X(m) 按 照 m 的 奇偶 进行 分 组 分 解 再 来 计算 , 则 称 为 按照 频 
率 分 组 的 FFT 算法 。 两 者 推导 过 程 相似 ,计算 量 相当 ,仅仅 是 算法 结构 不 同 而 已 。 如 果 N 不 
是 2 的 整数 次 宕 ,此 时 其 FFT 算法 比较 复杂 ,这 里 则 不 再 介绍 。 

4.2.5 快速 傅立叶 变换 的 买 现 

本 节 将 结合 上 述 理论 给 出 具体 的 实现 方法 ,包括 Matlab 的 仿真 实现 以 及 基于 C 语言 此 
适用 于 DM642 系统 的 具体 代码 ,以 便 读者 深入 了 解 锐 化 的 基本 概念 及 其 特点 ,掌握 其 实现 
方法 。 
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1. Matlab 仿真 

(1) 傅立叶 变换 平移 性 

(DM 文件 程序 清单 

f =zeros(512,512); 

f(206:305,236.275) =1; 

figure(1) ; 

imshow(f); 96 图 像 定 义 

tile 原始 图 像 ') ; 

F = fftshift( abs( fft2 (£) ) ) ; 

figure(2) ; 

imshow(F,[ -1,5)]); 

title ( 原始 图 像 的 傅立叶 变换 频谱 ') ; 

f = zeros(S12..$12 ) ; 

f(206:305,300:339) =1; 

figure(3) ; 

imshow( f) ; 

title( X 轴 方 向 移动 后 的 图 像 ') ; 

F = fftshift( abs( fft2 (£) ) ) ; 

figure(4) 

imshow(F,[ -1,5]); 

tide X 58177 I8] e JJ E fv Hp EROS ') ; 

@) 仿 真 结果 

@) 仿 真 结果 分 析 

仿真 结果 如 图 4-8 所 示 , 设 图 像 在 空间 城 表 示 为 f(x y ) ,在 频 域 表示 为 F(x,y) ,对 比 
图 4-8a) RI b) ,可 以 发 现在 空间 域 所 xs,y) 向 右 平移 后 ,在 频 域 的 F(x,y) 的 幅 值 并 没有 发 生 改 
变 , 如 4.2.3 节 中 所 述 , 平 移 不 改变 傅立叶 变换 的 幅 值 。 

(2) 傅立叶 变换 旋转 性 

CDM 文件 程序 清单 

f =zeros( 512,512); 

f(206:305,236:275) =1; 

figure( 1); 

imshow(f) ;”% 图 像 定义 

tile(' 原始 图 像 ') ; 

F =fftshift(abs(ff2(f) ) ) ; 

figure(2) ; 

imshow( F,[ -1,5]); 

title( 原始 图 像 的 傅立叶 变换 频谱 ') ; 

f 2zeros( 512,512) ; 

ce 9e 


f(206:305,236:275) 三 十 ; 

f = imrotate(f,45 , 'bilinear' ，crop ) ; 
figure(3) ; 

imshow( f) ; 

title( 图 像 正 向 旋转 45?) ; 

F =fftshift( abs( fft2 (£) ) ) ; 
figure(4) ; 

imshow(F,| -1,5]); 


tite( 图 像 旋转 45" 后 的 傅立叶 变换 频谱 








a) 平移 前 图 像 及 其 频谱 





b) 平 移 后 图 像 及 其 频谱 


| 


到 4-8 仿真 结果 

@) 仿 真 结果 

@@ 仿 真 结果 分 析 

设 图 像 在 空间 域 表示 为 f(x,y) ,在 频 域 表 示 为 F(x,y) ,对 比 图 4-9a) 和 b) ,可 以 发 现在 空 
间 域 f(x,y) 逆 时 针 旋 转 45° 后 ,在 频 域 R(x,y) 也 同样 逆 时 针 旋 转 了 45?, 如 4.2.3 节 所 述 ,如 
果 图 像 本 身 在 空间 域 上 旋转 , 则 其 二 维 离散 傅立叶 变换 在 频 域 上 也 会 旋转 ,而 且 旋 转 的 角度 
相同 





a) 旋转 前 图 像 及 其 频谱 


sS 





b) 旋转 后 图 像 及 其 频谱 
图 4-9 仿真 结果 


基于 DM642 系统 的 程序 

TMS320DM642 是 TI 公司 C6000 系列 DSP 中 的 定点 DSP ,在 数字 视频 /图 像 处 理 等 领域 
被 广泛 应 用 , 常 应 用 C 语言 进行 开发 ,由 于 其 运行 速度 快 且 具有 极 强 的 运算 能 力 ,所 以 适 
用 于 各 种 图 像 处 理 算法 的 实现 。 本 书 结合 DM642 系统 给 出 图 像 依 立 叶 变换 算法 的 C 语 
言 实现 

(1) 二 维 傅立叶 变换 及 其 逆 变 换 DM642 程序 清单 

&include < stdio. h > 

#include < stdlib. h > 

#include < math. h > 

#define pi 3.1415 

#define Width 512 

#define Height 350 

void ReadImage( char cFileName ) ; 

void bmpDataPart( FILE” fpbmp) ; 

void fft( ) 
dics 


void ifft( ) ; 
#pragma DATA. SECTION ( input ,". my. sect") 
#pragma DATA, SECTION ( fdout ,". my. sect") 
#pragma DATA. SECTION( tdout ,". my, sect") 
#pragma DATA, SECTION( fd. re,". my. sect") 
#pragma DATA. SECTION( fd. im ,". my, sect") 
#pragma DATA, SECTION( td, re,". my, sect") 
#pragma DATA, SECTION( td, im". my, sect") 
#pragma DATA, SECTION ( wx1, re ,". my, sect") 
*pragma DATA, SECTION ( wx1, im ,". my, sect") 
#pragma DATA, SECTION( wx2 re". my, sect") 
#pragma DATA, SECTION( wx2. im". my, sect") 
#pragma DATA, SECTION ( wco, re ,". my, sect") 
#pragma DATA. SECTION ( wco, im ,". my, sect") 
#pragma DATA, SECTION ( hx1. re,". my. sect") 
#pragma DATA. SECTION( hx1. im,". my. sect") 
#pragma DATA. SECTION ( hx2. re,". my, sect") 
#pragma DATA, SECTION( hx2. im,". my. sect") 
#pragma DATA, SECTION ( hco, re ,". my, sect") 
#pragma DATA. SECTION ( hco, im,". my. sect") 
unsigned char input| Height ] [ Width ] ; 

unsigned char fdout| Height | | Width | ; 

unsigned char tdout| Height | [ Width ] ; 

double fd, re[ Height | | Width | ; 

double fd, im[ Height | | Width | ; 

double td, re[ Height | | Width | ; 

double td. im[ Height ] [ Width | ; 

double wxl_re[ Width | ; 
double wx1. im| Width ] ; 
double wx2, re| Width | ; 
double wx2. im| Width ] ; 
double wco, re[ Width | ; 
double wco, im| Width | ; 
double hx1, re| Height | ; 
double hx1, im[ Height | ; 
double hx2, re[ Height | ; 
double hx2_iml Height | ; 
double hco, re| Height] ; 
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double hco, im| Height | ; 
void main( ) 


! 
| 


ReadImage( "G : Vcargray512. bmp") ; 
fit( ); 
ifft( ) ; 
while (1); 
| 
void ReadImage( char * cFileName) 
| 
FILE *fp; 
if ( fp 2 fopen( cFileName ,"rb" ) ) 
| 
bmpDataPart( fp) ; 
fclose( fp) ; 


void bmpDataPart( FILE" fpbmp) 
| 
int i, j 20; 
unsigned char * pix 2 NULL; 
fseek( fpbmp, 1078L, SEEK SET) ; 
pix = ( unsigned char” ) malloc ( Width ) ; 
for(j 20;j < Height;j + +) 
| 
fread( pix, 1, Width , fpbmp) ; 
for(i =0;i « Width;i + +) 
| 
input[ Height - 1 -j] [i] zpix[i]; 


| 

void fft( ) 

| 
int i,j; 
int w,h; 
int wp,hp; 
int a,b,c; 

三 = ES 


int p ,bfsize ; 
double angle; 
double dtemp ; 
double x. re,x, im; 
double ta,tb tc ,td ; 
unsigned char temp; 
wel; 
h=1; 
wp 20; 
hp 20; 
while(2* w < = Width) 
| 

w“ 22; 

wp+ +; 


l 
} 


while(2'h < = Height) 
| 
h* z2; 
hp + +; 
| 
for(i=0;i<h;i+ + )// x 轴 进 行 快速 健 立 叶 变 换 
| 
for(j20;j <w;j+ +) 
| 
temp = inputLi][j]; 
wxl_re|j] = (double) ( temp) ; 
wxl. im[j] 20; 
| 
for(j =0;] < ( Width/2);j+ +) 
| 
angle = -j pi " 2/Width ; 
wco. re[ j] 2 cos( angle) ; 
wco, im[ j] = sin( angle) ; 
| 
for(a=0;a <wp;a+ +) 
| 
for(b =0;b<(1<<a);b++) 
| 
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bfsize Zl < < (wp-a); 
for( e 20;c «(bfsize/2) ;c + +) 
| 
p =b” bfsize; 
wx2 re[c +p] =wxl_re[c+p] + wxl_re[c +p + bfsize/2]; 
wx2_im| c +p] =wxl_im[c +p] + wxl_im| c +p + bfsize/2] ; 
ta=wxl_re[c+p] — wxl_re[ c +p + bfsize/2] ; 
tb =wxl_im[c +p] - wxl_im[ c +p + bfsize/2 | ; 
te 2 wco re[ c* (1 « <a)]; 
td = wco im[c*(1« «a) |; 
wx2 re| c +p + bfsize/2] =ta * te — tb * td; 
wx2 im[c +p + bfsize/2] =ta*td + tb * tc; 


| 

for(c=0;c < Width;c + +) 
x_re =wxl_re[ c]; 
x_im =wxl_im[c]; 
wxl re[c] =wx2_re[c]; 
wxl. im[c] 2wx2 im[c]|; 
wx2 re[ c] 2x re; 


wx2 im|c] -x im; 


| 
for(b=0;b<Width;b+ +) 
| 

p=0; 

for(c Z0;c <wp;c+ +) 


1 


| 
if(b & (1« <c)) 
p*zl««(wp-c-1); 
| 
fd_re[i][b] =wxl_re[ p]; 


fd im[i][b] =wxl_im[p]; 
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for(j =0;j <w;j + + )// 沿 y 轴 进 行 快速 傅立叶 变换 
| 
for(iz0;i«h;i-* +) 
| 
hxl re[ i] 2fd re[i][j]; 
hx1 im[i] 2fd im[i][j]; 


| 
Í 


for(i =0;i < (Height/2);i+ +) 
! 


angle = — i * pi * 2/Height; 
hco re[ i] 2 cos(angle) ; 
hco im[i] -sin(angle) ; 
| 
for(a=0;a <hp;a + +) 
| 
for(b =0;b<(1< <a);b+ +) 
| 
bfsize =1 < < (hp -a); 
for(c=0;c «(bfsize/2) ;c + +) 


| 
1 
t 


p =b” bfsize; 

hx2 re[c +p] =hxl_re[c+p] + hxl_re[c +p + bfsize/2] ; 
hx2_im[c +p] =hxl_im[c +p] + hxl_im[c +p +pbfsize/2]; 
ta z-hxl re[ c +p] - hxl_re[ e +p +bfsize/2]; 

tb =hxl_im[c +p] - hxl_im[c +p + bfsize/2]; 

te =hco_re[c* (1< <a)]; 

td =hco_im[c* (1< <a)]; 

hx2_re[ c +p + bfsize/2] =ta *te — tb * td; 

hx2_im[ c * p + bfsize/2] =ta *td + tb * tc; 


| 
for(c =0;c «Height;c + +) 
| 
x_re =hxl_re[c]; 
x_im =hxl_im[c]; 
hxl_re[c] =hx2_re[c]; 
hxl_iml c] =hx2_im[c]; 
hx2_re[ c] =x_re; 
— 5 — 
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hx2 im[c] =x_im; 


| 
for(b =0;b < Height;b+ +) 
| 
p=0; 
for(c=0;c <hp;c+ +) 
| 
if(b & (1« «c)) 
| 
p+=l<<(hp-c-1); 


| 
fd re[b][j] =hxl_re[p]; 
fd im[b][j] 2hxl im[ p]; 


| 
for(1=0;1<Height;i++) 
for(j =0;j<Width;j+ + ) 


| 
1 


dtemp = sqrt(fd_re[l i][j] *fd re[i][j] + fd im[i][j] *fd im[i][j))/100; 
i dtp 5-255) 
| 
dtemp =255; 
| 
fdout[i][j] = (unsigned char) ( dtemp) ; 


| 


| 

void ifft( ) 

| 
Inl 1,]5 
int w,h; 
int wp,hp; 
int a,b,c; 
int p,bfsize ; 
double angle ; 


— 100 — 


double dtemp ; 

double x_re ,x_im ; 
double ta ,tb ,tc , td ; 
w=l; 

h-l; 

wp 20; 

hp 20; 

while(2* w < = Width) 


while(2 * h < = Height) 
| 

h* 22; 

hp+ +; 


| 
Í 


for(i =0;i<h;i + + )// 沿 x 轴 进 行 快速 傅立叶 变换 


| 
for(j =0;j <w;j+ +) 
| 
wxl_re[j] =fd_re[i][j]; 
wxl_im[j] =fd_im[i][j]; 


for(j20;j «wi;j * +) 
wxl im[j] = - wxl. im[j]; 


for( j =0;j < (Width/2) ;j + +) 





angle = -j * pi * 2/Width; 
wco, re[ j] 2 cos( angle) ; 
wco. im[ j] 2sin(angle) ; 
| 
for(a=0;a <wp;a++) 


| 


for(b =0;b<(1< <a);b+ +) 


| 
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bfsize Z1 < < (wp -a); 
for(c 20;c < (bfsize/2);c+ +) 
| 
pzb'bfsize; 
wx2_re[c +p] 2wxl re[ c +p] + wxl re[ c +p * bfsize/2 ] ; 
wx2 im[c*p] 2wxl im[c*p] + wxl_im[c +p + bfsize/2 | ; 
ta -wxl re[ c +p] - wxl_re[ c +p * bfsize/2]; 
tb =wxl_im[c +p] - wxl, im[ c +p + bfsize/2] ; 
tc 2wco re[c (1« «a) ]; 
td 2 wco im[c'(1« «a) ]; 
wx2 re[ c +p + bfsize/2] =ta * te — tb * td; 
wx2 im|c +p + bfsize/2] =ta * td + tb * tc; 


| 
for(c=0;c < Width;c + +) 
| 
x re =wxl_rel c] ; 
x imz wxl im[c]; 
wxl re[ c] 2 wx2 re[ c]; 
wxl im[c] 2 wx2 im[c]|; 
wx2 re| c] 2x re; 


wx2 im[c| -x im; 


| 
for(b 20;b < Width;b + +) 
| 
p=0; 
for(c=0;c <wp;c+ +) 
| 
if(b & (1« «c)) 
| 


p+=1l<<(wp-c-1); 


| 
td_re[i][b] =wxl_rel p]; 
td_im[i][b] 2wxl im[p]; 
| 
for(j =0;j < Width;j + +) 
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td re[ 1] [jj 2td re[ i] [ j ]/Width; 
td. im[i][j] = - td im[ i] [j]/Width; 


| 
for(j =0;j <w;j+ + )// 沿 y 轴 进 行 快速 傅立叶 变换 
| 
for( i =0;1 <h;i d ) 
| 
hxl_re[i] =td_re[i][j]; 
hxl_im[i] =td_im[i][j]; 


for(i=0;i<h;i+ +) 
hxl_im[i] = -hxl_im[i]; 


for(i =0;i < ( Height/2) ;i + 4 ) 





angle = -i pi * 2/ Height; 
hco re[i] = cos(angle) ; 
hco_im[ i] = sin(angle) ; 
| 
for(a=0;a<hp;a+ +) 
| 
for(b =0;b<(1<<a);b++) 
| 
bfsize =1< < (hp-a); 
for(c 0;c < (bfsize/2) ;c + +) 
| 
pzb'bfsize; 
hx2 re[c +p] 2hxl re[c +p] + hxl re[ c +p * bfsize/2] ; 
hx2 im[c +p] =hxl_im[c +p] + hxl, im[ c +p + bfsize/2] ; 
ta zhxl re[c * p] - hxl re[ c +p 4 bfsize/2] ; 
tb =hxl_im[c +p] - hxl im[ c +p + bfsize/2] ; 
tc z heo re( c (1< «a)]; 
td 2 hco im[c* (1 « «a) ]; 
hx2 re[ c + p + bfsize/2] =ta * te — tb * td; 
hx2 im[c +p + bfsize/2] =ta * td + tb * tc; 
= 103 — 
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| 


for(c=0;c < Height;c + +) 
| 
x re - hxl re(c]; 
x im-hxl im[c]; 
hxl_re[ c] 2 h2. re[ c] ; 
hxl. im[c] 2 hx2 im[ c |; 
hx2 re( c] 2x re; 


hx2 im[c] 2x im; 


| 
for(b =0;b < Height;b + +) 
| 
p 70; 
for(c =0;c <hp;c + +) 
| 
if(b & (1« «c)) 
| 
p+=l1<<(hp-c-1); 


td_re[b][j] =hxl_re[p]; 
td_im[b][j] =hxl_im[p]; 

| 

for(i =0;i < Height;i + +) 

| 
td re[ 1][j] 2 td re[ i] [ j ]/Height ; 
td, im[i][j] = - td im[i][j ]/Height; 


| 
for(i =0;i < Height;i + + ) 
| 
for(j 20;j < Width;j+ + ) 
| 
dtemp 7 td. re[ i1[j] ; 
if( dtemp » 255) 
| 
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dtemp -255; 
| 
tdout[ i][j] = (unsigned char) ( dtemp) ; 


| 

(2) CCS 仿真 结果 

选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗口 ,右键 单 击 图 像 窗口 选择 Proper- 
ties 进行 图 像 显示 配置 ,设置 如 图 4-10 中 所 示 。 





—  ENSS*98 








































Value 
4 General 4 General 
Title Title Image 
Background color Background color RGB (255, 255, 255) 
Image format Image format RGB 
4 RGB 4 RGB 
Number of pixels per line Number of pixels per line 256 
Number of lines Number of lines 256 
Data format Data format Planar 
Pixel stride (bytes) Pixel stride (bytes) 1 
Red mask Red mask OxFF 
Green mask Green mask OxFF 
Blue mask Blue mask OxFF 
Alpha mask (if any) Alpha mesk (if any) 0x00 
Line stride (bytes) 256 Line stride (bytes) 256 
Image source Connected Device Image source Connected Device 
Red start address input Red start address fdout 
Green start address input Green start address fdout 
Blue start address input Blue «tart address m dos ——— F 
Alpha start address (if any) Alpha start address (if any) 
Read data as Read data as 8 bit data 









b) 伟 立 叶 变换 后 图 像 查 看 设置 





Property Value 


4 General 





















Title Image 
Background color RGB (255, 255, 255} 
| Image format RGB 
|| 4 RGB 
| Number of pixels per line 256 
| Number of lines 256 
| Data format Planar 
| Pixel stride (bytes) 1 
Red mask OxFF 
Green mask OxFF 
Blue mask OxFF 
Alpha mask (if any) 0x00 
Line stride (bytes) 256 
| Image source Connected Device 
| Red start address tdout 
Green start address tdout 
i Blue start address tdout 
Alpha start address (if any) 
8 bit data 









TERTE EE 
c) 傅立叶 逆 变 换 后 图 像 查看 设置 


图 4-10 CCS 设置 
(3) 仿 真 结果 (图 4-11) | 
sc js 2 
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c) 傅立叶 逆 变 换 图 像 


图 4-11 DM642 处 理 结果 


4.3 离散 余弦 变换 


由 前 一 节 内 容 可 知 傅立叶 变换 的 参数 都 是 复数 ,在 数据 的 描述 和 计算 上 都 比较 复杂 , 因 
此 ,期 望 有 一 种 功能 相同 但 计算 数据 量 不 大 的 变换 ,于 是 就 产生 了 离散 余弦 变换 。 

这 里 举 一 个 离散 余弦 变换 的 例子 来 说 明 : 如 果 有 一 个 连续 的 实 偶 函 数 f(x), 即 f(x) =f 
(=x) , 则 可 以 得 到 函数 的 傅立叶 变换 如 下 : 


F(u) 2 [A x) erwdx = | az)eos(2muz)dx - j | f(x) sin(2mux) dx 


= [f(x) eos(2mux) dx (4-44) 
由 于 虚 部 的 被 积 项 为 厅 函数 , 则 傅立叶 变换 的 虚数 项 为 零 , 但 这 种 变换 结果 中 只 有 余数 
项 ,因此 , 称 为 余弦 变换 ,由 此 可 以 看 出 余弦 变换 是 傅立叶 变换 的 特例 。 
4.3.1 离散 余弦 变换 原理 
PRIRA) 的 一 维 离散 余弦 变换 (DCT) 及 反 变 换 分 别 为 


=E= 


(2x + l)um s 
2N E 


C(u) = a(u) f(x) cos 


Jiu) = alu) f(x) cos C38 x 
式 中 : 
aw ted M D 当 w = 0 时 (4-47) 
V2/N 354 = 1,2,…,N-1 时 
将 上 面 的 一 维 余弦 变换 扩展 到 二 维 离散 余弦 变换 :定义 HKx,y) 为 WxN 的 数字 图 像 矩 阵 ， 
则 二 维 DCT 变换 对 定义 如 下 : 
C(u,v) = a(u)aCo) X, Y. fx, y) eos a d Eu LE 
(x,y 20,1,2,:«,N - 1) (4-48) 
二 维 离散 变换 反 函 数 为 ; 
Kasy) = alu)alo) X, Y. Clay) cos CA mu, Gat Der 
(x,y 20,1,2,-, N - 1) (4-49) 
将 式 (4-44) FIR (4-45 ) 进行 比较 ,可 以 看 出 二 维 DCT 变换 是 可 分 离 的 ,因此 二 维 正 向 或 
反 向 变换 能 够 逐次 应 用 一 维 DCT 算法 进行 计算 。 
上 面 介绍 的 都 是 一 般 的 DCT 算法 ,下 面 介绍 一 种 利用 FFT 的 典型 快速 算法 。 
一 维 DCT 与 DFT 具有 相似 性 , 重 写 DCT 如 下 : 


co) = z fo (4-50) 
EE) 
fine [en 








2 E 2d ux 
= ly Relw? x Lf(x)w | (4-51) 
272m fx) y e0.1,2, 5 N-1 
一 JIN 。 = 
ASETE un E x 2N,N1,-,2N -1 


对 比 DFT 的 定义 可 以 看 出 ,将 序列 扩展 之 后 ,DFT 的 实 部 对 应 DCT , 而 虚 部 对 应 着 离散 正 
弦 变 换 , 因 此 可 以 利用 FET 实现 DCT。 这 种 方法 的 缺点 是 将 序列 扩展 后 增加 了 一 些 不 必要 的 
计算 量 ,此 外 ,这 种 计算 也 容易 造成 误解 。 

离散 余弦 变换 实质 上 是 一 种 傅立叶 变换 的 特例 。 离 散 傅立叶 变换 实际 上 是 储 立 叶 变 换 的 
实数 部 分 , 比 傅立叶 变换 具有 更 好 的 信息 集中 能 力 。 对 于 大 多 数 自 然 图 像 , 离 散 余 弦 变 换 能 够 
将 大 多 数 的 信息 放 到 较 少 的 系数 上 ,因此 就 能 够 提高 编码 的 效率 。 

目前 使 用 十 分 广泛 的 JPEG 格式 图 像 就 是 采用 了 离散 余弦 变换 ,JPEG 的 图 像 压缩 率 甚 至 
能 够 达到 10% 以 下 ,但 在 视觉 上 几乎 看 不 到 差异 。 
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4.3.2 ”离散 余弦 变换 的 实现 


(DMatlab 程序 

在 Matlab 中 DCT2 水 数 方法 是 基于 FET 算法 来 实现 较 大 输入 的 快速 计算 方法 ,下 面 使 用 
DCT2 函数 来 实现 图 像 压 缩 。 

RGB =imread('e: \matlab2012 \myfiles \car. bmp') ;% 读 取 原 始 图 像 

GRAY = rgb2gray ( RGB) ;% 将 图 像 转化 为 灰 度 图 

figure( 1 ) ;imshow( GR);% 显 示 转 换 后 的 灰 度 图 

D =dct2(GRAY);% 计 算 DCT 

figure(2) ;imshow(log( abs( D) ) ,| |); 

colormap( gray (4) ) ; 

colorbar ; 

@) 仿 真 结果 

@ 仿 真 结果 分 析 

在 上 述 程序 中 我 们 对 原 图 像 进 行 离散 余弦 变换 ,得 到 的 图 像 如 图 4-12b) 所 示 , 从 图 4-12b) 
可 知 变换 后 的 DCT 系数 能 量 主要 集中 在 左上 和 角 ,其 余 大 部 分 系数 接近 零 ,利于 图 像 的 压缩 。 将 
变换 后 的 DCT 系数 进行 门限 操作 ,然后 进行 DCT 的 逆 运 算 ,得 到 压缩 后 的 图 片 如 图 4-120) 
所 示 












b) 余 弦 变 换 结果 


id - T 
c) Fs 


图 4-12 [ESSE 
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4.4 沃 尔 什 和 哈达 玛 变换 


傅立叶 变换 和 离散 余弦 变换 都 是 以 正弦 和 余弦 等 三 角 函 数 作为 基本 正 交 函数 基 , 这 类 算 
法 性 能 强 ,效果 好 ,但 都 会 用 到 复数 乘法 .三 角 函 数 乘 法 ,算法 的 复杂 度 较 高 ,在 一 些 领域 并 不 
适用 。 非 正弦 类 变换 ,如 沃 尔 什 ( Wash) 变换 和 哈达 玛 ( Hadamard ) 变换 函数 基 为 二 值 正 交 基 ， 
与 数字 逻辑 的 两 个 状态 对 应 ,减少 了 存储 空间 ,并 且 提 高 了 计算 速度 ,在 需要 对 大 量 数据 进行 
实时 处 理 时 ,有 着 突出 的 优越 性 ,因而 在 信号 处 理 、 数 字 通 信 、 图 像 处 理 等 领域 中 均 有 广泛 的 
应 用 。 

4.4.1 WINTER 

一 维 沃 尔 什 函数 是 沃 尔 什 于 1923 年 提出 的 取 值 为 +1 ER EXER, EX 
域 归 一 化 的 沃 尔 什 函数 可 以 表示 为 Wal(u,0)。 由 于 沃 尔 什 函数 系 的 完备 性 ,任何 定义 域 在 区 
间 [0,1) 上 ,满足 绝对 可 积 条 件 的 函数 A(0) 均 可 以 在 沃 尔 什 函 数 系 上 展开 成 如 下 无 穷 级 数 的 
EX; 


KO) = XW(u)Wal(u,6) (4-52) 
其 中 ,WW(w) 是 函数 (9) 的 沃 尔 什 变换 系数 , 按 式 (4-53) 计 算 . 
W(uj = [ KO) Wal(u,0)d0 ES A I (4-53) 


式 (4-55 ) POS PRI SAO) 的 沃 尔 什 变换 。 对 于 点 数 为 V=2" 的 离散 序列 ,f()) ,7 =0,1,2,…， 
NN -1 的 离散 沃 尔 什 正 反 变换 为 . 
W(u) = ẸÈfG)Wallu,j) u 2 0,1, - 1 (4-54) 


Rje X Weu) Wal(u j) ud Ies aed (4-55) 


4.4.2. 哈达 玛 变换 

沃 尔 什 变换 是 哈达 玛 变换 的 基础 , 沃 尔 什 函数 有 多 种 排列 方式 ,哈达 玛 排列 的 沃 尔 什 函数 
是 其 中 一 种 特殊 情况 。 哈 达 玛 变换 是 由 2”(n =0,1,2,…) 阶 哈达 玛 矩 阵 得 到 的 ,而 哈达 玛 和气 
阵 最 大 的 优点 在 于 它 具 有 简单 的 递 推 关系 , 即 高 阶 矩 阵 可 用 两 个 低 阶 和 矩阵 求 得 ,这 给 实际 应 用 
带 来 了 极 大 的 便利 ,因而 也 是 使 用 最 多 的 ,大 多 数 场景 所 指 的 沃 尔 什 变换 就 是 沃 尔 什 一 哈达 玛 
变换 。 

1. 哈达 玛 阵 

哈达 玛 矩 阵 (Hadamard Matrix) 是 由 一 系列 的 方形 矩阵 组 成 ,此 处 用 符号 五 , 表示 ,下 面 介 
绍 几 个 最 基本 的 哈达 玛 矩 阵 如 下 : 
[1] (4-56) 


Ti 1 
i $ 2 s 


== 


H, 


l H, 
H, = 
-H 
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EP EM TENE 
SA D E Ix. 1 (4.58) 
H, -H, l^ 4$ ce4 -1 
i ai ci y 
哈达 玛 矩 阵 的 阶 数 是 按 N =2 (n =0,1,2,…) 规 律 排列 的 ,由 式 (4-55) , 5X (4-56) 和 
式 (4-58 ) 的 递 推 计算 规律 可 知 ,高 阶 的 哈达 马 和 矩阵 可 以 由 低 阶 的 哈达 马 矩 阵 通过 和 矩阵 的 直 积 运 
算 递 推 得 到 。 
XB AE Ep fts T6 X n] yg 2 V vi RA Kronecker Product) ,两 个 矩阵 4 和 B 的 直 积 运算 用 符号 
名 记 作 A@B, 具 有 如 下 运算 规律 . 





Ou dq i bu cda cv d 
Aa | m 77 0 Ig L|Pa n " (4-59) 
Qu C a b i b. bnn 
ju. 
anB aB > aB 
cA: : : (4-60) 
üt, B a, B dd a, B 
由 以 上 直 积 运算 可 以 递 推 得 到 ， 
Ha Hp- Hx Hx 
H, = H = H, ® Hi 一 = (4-61) 
Hpi ~Ha Hx - Hx 


M Lii B do nh TUE H, 03 33B [42 EA FILARE 633 4B EE IE CAR [e H. H 058 
1 与 -1 两 种 值 ,这 在 哈达 玛 变换 中 体现 出 来 就 是 只 有 加 \ 减 法 ,而 没有 乘除 法 。 这 种 特性 让 哈 
达 玛 变换 在 快速 算法 的 应 用 中 十 分 节省 硬件 资源 ,从 而 能 更 方便 的 加 快速 度 ,提高 易 实现 性 。 
哈达 玛 矩阵 的 这 些 性 质 使 得 哈达 玛 变换 在 处 理 信 号 ,尤其 是 多 维 信 号 时 ,往往 经 过 复杂 变换 和 
加 减 后 仍 能 保持 一 定 的 规律 性 与 简便 性 ,这 也 是 哈达 玛 变换 具有 简便 、 易 实现 特性 的 最 根本 
2. 二 维 离散 哈达 玛 变换 
二 维 离散 沃 尔 什 一 哈达 玛 的 正 变换 核 和 逆 变 换 核 分 别 为 : 
W(u,v) = 


XX È f(x,y) WalCu x) Wallv,y) (4-62) 


Fay) = AE X Wuv) WalCu x) Wal(v,y) (4-63) 


XUP xu 20,1,2,---,N -10;y,720,1,2,-, N - 1, 

例如 :按照 哈达 玛 变换 求 如 下 所 示 的 图 像 f 的 二 维 哈 达 玛 变换 时 ,根据 前 面 所 述 ,选择 相 
应 的 哈达 玛 和 矩阵 H, 对 其 进行 哈达 玛 变换 。 
一 110 一 
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1$ 3 1 Dod ow A 
| $53 1 lo 
RO eic e SL ec uc 
1503087 i "WEBER DE ES 
根据 式 (4-63 ) 可 得 ; 
fov tuo weis OCT 2 0 9-41 
podiich UR cT 59 BODL Gd 1108 8.9. 
ép. uu xErzedob ces 4p 74 n wed. 9 ü uw 0 
pop-sp Qd 3$ 3 qp wp oed dd D od 9 
(4-65) 


可 见 , 哈 达 玛 矩阵 具有 能 量 集中 的 性 质 ,哈达 玛 变 换 后 能 将 能 量 集中 到 图 像 的 边 角 。 因 
此 ,与 离散 传 立 叶 变换 ,离散 余弦 变换 等 正 交 变换 类 似 , 二 维 离散 哈达 玛 变换 能 够 使 图 像 信 息 
在 变换 域 更 集中 。 

4.4.3 ”哈达 玛 变 换 的 Matlab 实现 

CDMatlab 程序 清单 


cle; 





clear all; 

Image = imread( lena. jpg) ; 

H = hadamard (512) ; 96 j^^: 512X512 的 Hadamard 矩阵 

% 对 图 像 进行 哈达 玛 变 换 

Image = im2double( Image ) ; 

Halmage = H * Image * H; 

Halmage2 = Halmage/512 ; 

% 对 图 像 进行 哈达 玛 逆 变 换 

HHalmage = H * Halmage2 ' H'; 

HHalmage2 = HHalmage/512; 

Halmage2 = im2uint8 ( Halmage2 ) ; 

HHalmage2 = im2uint8 ( HHalmage2 ) ; 

figure(1) ; 

imshow ( uint8 ( Image) ) ; 

figure(2) ; 

imshow ( Halmage2 ) ; 

figure(3) ; 

imshow ( HHalmage2 ) ; 

@) 仿 真 结 果 

@ 仿 真 结果 分 析 

观察 图 4-13 仿真 结果 ,可 以 看 出 哈达 玛 变换 具有 能 量 集 中 的 性 质 ,图 像 越 平滑 即 原始 数 
-— 11 — 
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字 越 是 均匀 分 布 ,经 变换 后 的 数据 越 是 能 集中 到 图 像 的 左上 角 ,这 意味 着 可 以 用 哈达 玛 变换 来 
压缩 图 像 信息 。 





a) 原始 图 像 b) 哈达 玛 变换 结果 c) 哈达 玛 道 变换 结果 
图 4-13 ”仿真 结果 


4.5 本 章 小 结 


图 像 变 换 能 够 有 效 提高 图 像 处 理 的 效率 ,更 有 针对 性 地 对 图 像 进行 处 理 和 分 析 。 在 频 域 
空间 对 图 像 进 行 操 作 ,能 够 针对 图 像 中 不 同 频率 范围 内 分 量 进行 不 同 的 处 理 , 即 进行 不 同 的 滤 
波 ,能 够 有 效 改 变 图 像 整体 的 频率 分 布 ,这 在 图 像 去 噪 .增强 和 压缩 等 图 像 处 理 过 程 中 有 着 重 
要 的 意义 ,是 许多 图 像 预 处 理 操 作 的 重要 基础 。 本 章 对 图 像 由 空间 域 到 频 域 的 算法 进行 了 分 
析 和 研究 ,重点 研究 了 图 像 倩 立 叶 变换 .离散 余弦 变换 算法 . 沃 尔 什 和 哈达 玛 变换 算法 ,并 给 出 
了 相应 的 CCS 和 Matlab 程序 实现 。 


1. 什么 是 图 像 变 换 ? 为 什么 要 进行 图 像 变 换 ? 

2. 离散 傅立叶 变换 的 性 质 及 在 图 像 处 理 中 的 应 用 有 哪些 ? 
3. 请 尝试 对 雷 娜 图 进行 傅立叶 变换 和 反 变 换 操作 。 

4. 离散 余弦 变换 和 离散 傅立叶 变换 有 哪些 异同 点 ? 

5. 沃 尔 什 和 哈达 玛 变换 同 傅立叶 变换 、 余 弦 变 换 有 什么 区 别 ? 


È 





a l 


5.1 前 


了 


图 像 从 采集 到 传输 存储 的 过 程 中 ,难免 受 多 种 因素 影响 而 导致 图 像 与 原始 场景 之 间 存 在 
差异 。 例 如 , 受 光照 不 足 ` 相 对 运动 .噪声 干扰 等 影响 ,图 像 往往 模糊 不 清 , 或 者 难以 从 中 获取 
特征 信息 ,为 了 提高 图 像 质量 ,减少 干扰 因素 对 图 像 的 影响 ,图 像 增强 技术 应 运 而 生 。 图 像 增 
强 是 数字 图 像 处 理 技术 的 重要 组 成 部 分 ,能 够 有 目的 性 地 增强 图 像 的 整体 效果 或 是 突出 图 像 
的 局 部 细节 部 分 ,同时 抑制 不 必要 的 信息 ,改善 图 像 的 质量 ,把 模糊 的 图 像 变 成 清晰 的 图 像 ,以 
便 在 后 续 的 特征 分 析 时 ,计算 机 视觉 系统 可 以 更 好 地 理解 图 像 。 图 像 增强 的 目的 主要 包括 以 
下 两 个 方面 :一 是 减少 噪声 ;二 是 增强 对 边缘 信息 和 结构 信息 的 保护 ,提取 隐藏 在 图 像 中 的 信 
息 或 是 提高 低 对 比 度 图 像 的 对 比 度 。 从 增强 处 理 的 作用 域 出 发 ,图 像 增强 可 分 为 空间 域 图 像 
增强 和 频率 域 图 像 增 强 两 种 。 空 间 域 方法 是 在 原 图 像 ( 空间 域 ) 直接 进行 增强 处 理 ,频率 域 增 
强 是 通过 图 像 变 换 ,在 频 域 对 图 像 进行 处 理 ,恰当 的 选择 和 使 用 图 像 增 强 技 术 能 够 有 效 抑制 原 
始 图 像 中 的 干扰 信息 ,突出 图 像 的 特征 信息 。 一 般 来 说 ,图 像 增 强 放 大 了 目标 信息 和 图 像 背 景 
之 间 的 强度 差异 。 需 要 注意 的 是 图 像 增强 并 不 意味 着 增加 图 像 中 的 原始 信息 量 或 是 人 为 改变 
图 像 原始 信息 ,往往 在 增强 这 一 过 程 中 还 会 丢失 某 些 信息 ,是 因为 图 像 增强 是 在 依据 原始 图 像 
的 基础 上 ,采用 适合 的 处 理 方法 ,使 图 像 中 重要 的 整体 或 局 部 特征 得 以 加 强 , 从 而 提升 了 对 
特定 信息 的 识别 能 力 ,为 后 续 分 析 做 好 准备 。 本 章 前 两 节 介 绍 了 几 种 经 典 的 图 像 增 强 方 
法 ,包括 灰 度 变换 直方 图 修正 、 均 衡 化 等 方法 ,后 面 详细 介绍 了 图 像 平 滑 和 锐 化 的 算法 。 


5.2. 直接 灰 度 变换 


一 般 的 成 像 系 统 具 有 一 定 的 亮度 范围 ,我们 称 亮度 的 最 大 值 与 最 小 值 之 差 为 对 比 度 。 由 
于 成 像 系 统 亮度 范围 有 限 , 常 出 现 对 比 度 不 足 的 弊病 ,使 人 眼 观察 图 像 时 视觉 效果 很 差 。 通 过 
灰 度 变换 可 使 图 像 动 态 范围 加 大 ,图 像 对 比 度 扩展 ,图 像 清晰 ,特征 明显 ,从 而 大 大 改善 图 像 的 
视觉 效果 。 

灰 度 变换 是 图 像 增强 的 重要 手段 之 一 ,主要 利用 点 运算 来 修正 像素 灰 度 ,由 输入 像素 点 的 
灰 度 值 确定 相应 输出 点 的 灰 度 值 ,是 一 种 基于 图 像 变 换 的 操作 。 灰 度 变换 不 改变 图 像 内 的 空 
间 关 系 , 除 了 灰 度 级 的 改变 是 根据 特定 的 灰 度 函数 变换 进行 之 外 ,可 以 看 作 是 “从 像素 到 像 
素 " 复 制 操作 。 灰 度 变换 法 又 分 为 灰 度 线性 变换 和 灰 度 非 线 性 变换 两 种 。 
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5.2.1 灰 度 线性 变换 

灰 度 级 线性 变换 增强 是 空间 域 图 像 增强 的 一 种 ,是 指 对 每 个 线段 逐个 像素 进行 处 理 , 它 可 
将 原 图 像 灰 度 值 动态 范围 按 线性 关系 式 扩 展 到 制定 范围 或 整个 动态 范围 。 如 果 原 图 像 
f(x,y) 的 灰 度 范围 是 [m,M] ,希望 变换 后 的 图 像 g(x,y) 的 灰 度 范围 是 [n,N], 则 可 以 设计 如 
下 变换 ， 


eG) ear ef Gy) =m] +n (5-1) 





T NE LRL E -六 二 m, 式 (5-1) 可 简化 成 线性 点 的 运算 式 (5-2) 。 








g(x,y) 2 of(x,y) +B (5-2) 
对 应 的 图 像 如 图 5-1 所 示 。 
在 曝光 不 足 或 过 度 的 情况 下 ,图像 的 灰 度 会 局 限 在 
一 个 很 小 的 范围 内 ,这 时 得 到 的 图 像 可 能 是 一 个 模糊 不 
清 、 似 乎 没有 灰 度 层次 的 图 像 。 采 用 线性 变换 对 图 像 中 
每 一 个 像素 灰 度 作 线 性 拉 伸 ,将 有 效 地 改善 图 像 视觉 





9 m M fe» 计 分 段 的 线性 变换 。 通 过 分 段 线性 变换 函数 来 调整 图 像 


n 效果 。 
若 要 对 图 像 的 对 比 度 做 比较 精确 的 调整 , 则 可 以 设 
图 5-1 简单 线性 变换 灰 度 级 的 动态 范围 。 


通过 点 (7 ,si AAC ss) 的 位 置 控制 变换 函数 的 形状 。 点 (ms ) 和 点 (mm ,s ) 的 中 间 值 
将 产生 输出 图 像 中 灰 度 级 不 同 程度 的 展开 ,因而 影响 其 对 比 度 ,以 达到 增强 网 像 的 目的 。 分 段 
线性 变换 公式 见 式 (5-3 ) 。 
Yı f(x,y) +b, 0 «f(x,y) <fi 
gy) «10s Jis) Fb fi «fix.y) «f, (5-3) 
ys f xy) +b, h «f(x,y) «f, 








Hm. 
nz. bg 
g. s M b, 2g, -nfi (5-4) 
837 E. 
d m E c M 
其 变换 图 形 如 图 5-2 所 示 。 e 
可 以 通过 控制 调节 点 的 位 置 和 分 段 线段 的 斜率 ,对 fe) 


任 一 灰 度 区 间 进 行 拉 伸 或 压缩 。 当 图 像 的 灰 度 集中 在 较 图 5-2 分 段 线 性 变换 示意 图 
edid ee 
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暗 的 区 域 ,应 取 和 斜率 大 于 1; 当 图 像 的 灰 度 集中 在 较 亮 的 区 域 ,应 取 和 斜率 小 于 1。 分 段 线性 变换 
可 以 根据 用 户 需 要 , 拉 伸 特征 物体 的 灰 度 细节 ,虽然 其 他 灰 度 区 间 对 应 的 细节 信息 有 所 损失 ， 
但 这 对 于 识别 目标 来 说 没有 什么 影响 。 下 面 针 对 一 些 特 殊 的 情况 进行 分 析 。 

34 y, =y =0 时 ,表示 对 于 [fi,] 以 外 的 原 图 灰 度 不 感 兴趣 , 均 令 为 0, 则 均匀 的 变换 成 
新 图 灰 度 。 

X y, Sy, Sy, 0, BÆ g =g 时 ,表示 只 对 [万 , 亡 ] 间 的 灰 度 感 兴趣 ,上 且 均 为 同样 的 白色 ， 
其 余 变 黑 ,此 时 图 像 对 应 变 成 二 值 图 。 这 种 操作 又 称 为 灰 度 级 (或 窗口 ) 切片 。 

M y, =y =1,g1 =g =g 时 ,表示 保留 背景 的 前 提 下 ,提升 [ 放 , 户 ] 间 像 素 的 灰 度 级 。 它 
是 一 种 窗口 或 灰 度 级 切片 操作 。 

对 比 度 拉 伸 是 最 简单 的 分 段 线 性 函数 之 一 ,处 理 对 比 度 低 的 图 像 时 非常 有 效 , 其 优势 
是 扩展 后 的 灰 度 级 可 以 跨越 记录 介质 和 显示 装置 的 全 部 灰 度 级 范围 , 且 原 理 易 理解 、 操 作 
简单 。 

5.1.2 ” 灰 度 非 线性 变换 

由 于 图 像 中 弱 边 缘 处 两 侧 灰 度 差别 不 明显 , 且 同 一 边缘 线 上 不 同 的 边缘 点 的 梯度 幅 值 有 
高 有 低 , 所 以 若 能 先 将 边缘 两 侧 的 灰 度 差 增 大 ,同时 保证 位 于 边缘 同一 侧 的 像素 点 灰 度 值 接 
近 , 那 么 边缘 将 会 更 清晰 ,而 且 边 缘 所 在 处 梯度 值 也 会 变 大 。 这 可 以 通过 对 灰 度 值 作 非 线性 变 
换 来 实现 。 常 用 的 非 线 性 变换 函数 有 指数 函数 和 对 数 函 数 。 

对 数 变 换 的 一 般 形 式 为 : 
In| f(x,y) *1] (5-5) 


gley) cat b x Inc 


式 中 ,ao 和 是 为 了 便于 调整 曲线 的 位 置 和 形状 而 引入 的 参数 ;fx,y) +1 是 为 了 避免 
对 0 求 对 数 , 确 保 In[ f(x,y) +1]=0, 当 Kx,y) =0 时 ,In[ f(x,y) +1] 20,9] y Za, Bla X y 
轴 上 的 截 据 , 确 定 了 变换 曲线 初始 位 置 的 变换 关系 。b 和 < 两 个 参数 确定 变换 曲线 的 变化 速 
率 。 对 数 变换 用 于 扩展 低 灰 度 区 ,一 般 用 于 过 暗 的 图 像 。 

通过 对 数 变换 对 低 灰 度 范围 的 /进行 扩展 而 对 高 灰 度 范 围 的 上 进行 压缩 ,使 得 图 像 分 布 均 
匀 , 与 人 的 视觉 特性 相 匹配 。 参 数 取 a =200,b =0. 03 ,c =0. 2 时 图 像 的 对 数 变换 关系 如 网 5-3 
所 示 。 200 

指数 变换 的 一 般 形式 为 ; yon 


g(x,y) zen d uq (5-6) 160 


RP a b Lc 三 个 参数 也 是 用 于 调整 曲线 的 Fio 
位 置 和 形状 。 当 f(x,y) =a 时 ,g(%,y) =0, 此 时 “| 
指数 曲线 交 于 % 轴 , 由 此 可 见 参 数 a 决定 了 指数 
变换 曲线 的 初始 位 置 ;参数 c 决定 了 曲线 的 坡度 ， — 107 
即 决定 曲线 的 变化 速率 。 指 数 变换 用 于 扩展 高 灰 0i a a 
度 区 ,一 般 适 于 过 亮 的 图 像 。 fy) 

指数 变换 的 效果 与 对 数 变换 相反 ,使 图 像 的 图 5-3 参数 取 u =200 ,b 20.03,c =0. 2 时 对 数 变换 关系 
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高 灰 度 范围 得 到 扩展 。 灰 度 非 线性 变换 的 一 个 例子 是 动态 范围 压缩 ,该 方法 的 目标 与 增强 对 
比 度 相 反 , 有 时 原 图 的 动态 范围 太 大 ,超出 某 些 显示 设备 的 允许 动态 范围 ,这 时 如 果 直 接 使 用 





5000 原 图 则 一 部 分 细节 可 能 丢失 ,解决 的 办 法 是 对 原 
RA 图 进行 灰 度 压缩 。 图 像 的 对 数 变换 关系 如 图 5-4 
所 示 。 
3000 
A 5.2.3 图 像 线性 变换 的 实现 
| 在 本 节 中 将 结合 上 述 的 理论 ,分 别 给 出 具体 的 
实现 方法 ,设计 了 基于 Matlab 平台 和 DM642DSP 
0 系统 的 具体 代码 ,可 以 帮助 读者 深入 了 解 线性 变换 
m. 特点 ,掌握 其 实现 过 程 。 
0 50 100 150 200 250 300 


Fa 1. Matlab 仿真 实现 

图 5-4 参数 取 wu =200,b=0. 03,0 20.2 时 指数 变换 关系 (1) 分 段 线性 化 处 理 的 M 文件 源 代码 及 仿真 
结果 

GD 程序 源码 

A =imread('G:\cargrayl. bmp!) ; 

figure(1) ; 

imshow( A); 

title(' 原始 图 像 ) ; 

figure(2) ; 

imhist( A); 

title(' 原始 图 像 的 直方 图 ) ; 

% 分 段 线性 变换 的 系数 

f0 20; 


gà 2255; 
rl = (gl - g0)/(fl -f0) ; 
bl 2g0 -rl * f0; 
r2 = (g2 - g1)/(f2 - fl); 
b2 2gl -r2 * fl; 
r3 = (g3: g2)/(f3. 2) ; 
b3 =g2 -r3 * f2; 
% 线 性 变化 过 程 
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[m,n] =size(A) ; 
B = double( A) ; 


forizl:m 
for j 21:n 
f zB(i,j); 
g(i,j) 20; 


if(f» 0)&&(f« -fl) 
g(i,j) »rl *f*bl; 
elseif(f > 2f1) &&(f« =f2) 
g(i,j) 212 *f+b2; 
elseif (f > =f2)&&(f < =f3) 
g(i,j) 213 *f+b3; 
end 
end 
end 
C z uint8(g) ; 
figure(3) ; 
imshow( C); 
title(' 变换 后 的 图 像 ) ; 
figure(4) ; 
imhist( C) ; 
title(' 变换 后 图 像 的 直方 图 ) ; 


@) 仿 真 结果 
(2) 指数 变换 处 理 的 M 文件 源 代码 及 仿真 结果 
中 程序 源码 


A = imread( 'G ; \cargray2. bmp!) ; 
figure(1) ; 
imshow( A) ; 
title(' 原始 图 像 ) ; 
figure(2) ; 
imhist( A ) ; 
title(' 原始 图 像 的 直方 图 s 
% 指数 变换 的 参数 
a=2; 
b -1.4; 
as 
% 线 性 变化 过 程 
[m,n] =size( A); 
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B = double( A) ; 
for 1=1.m 
for j =1:n 
[-B(i,j; 
g(i,) =b (ct 
end 
end 
C =uint8 (g); 
figure(3) 


imshow( C); 

title( 变换 后 的 图 像 ') 
figure(4) ; 

imhist( C ) ; 

title( 变换 后 图 像 的 直方 图 
@) 仿 真 结果 (BI 5-5) 





a) 原始 图 像 





c) 分 段 线性 化 变换 图 像 


图 5-5 
3 仿真 结果 (图 5-6) 
一 118 一 


(f-a)) - 














| 
ll IL I JL | 


| IM | 


d) 变换 后 的 直方 图 


分 段 线性 化 变换 仿真 及 直方 图 
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b) 变 换 前 的 直方 
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c) 指数 变换 图 像 d) 变换 后 的 直方 图 


图 5-6 指数 变换 后 图 像 及 直方 图 
(3 ) 对 数 变换 处 理 的 M 文件 源 代码 及 仿真 结果 
QD 程序 源码 
A =imread('G; Vcargray3. bmp!) ; 
figure( 1) ; 
imshow( A); 
title( 原始 图 像 ) ; 
figure(2) ; 
imhist( A); 
title( ' 原始 图 像 的 直方 图 ) ; 
% 对 数 变换 的 参数 
a =200; 
b 20.03; 
e 20.2; 
% 对 数 变 化 过 程 
[m,n] =size( À) ; 
B = double( A); 


forizl:m 











= 
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for ] =1:n 
t= B(i 
g(i,j) =a+log(f +1)/(b* log(c)); 
end 
end 
C =uint8 (g); 
% imwrite( C ,'G:\cargray512a. bmp','bmp') ; 
figure(3) ; 
imshow( C); 
title(' 变换 后 的 图 像 ') 
figure(4) ; 
imhist( C); 
title( ' 变 ib is EE 
@) 仿 真 结 果 ( 图 5-7 




















a) 原始 图 像 b) 变换 前 的 直方 图 
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c) 对 数 变 换 图 像 d) 变换 后 的 直方 图 


图 5-7 对 数 变换 后 图 像 及 直方 图 
2. DSP 系统 的 算法 实现 


本 节 基 于 TMS320DM642 DSP 处 理 平 台 ,给 出 图 像 线 性 变换 算法 的 C 语言 实现 。 
P. = 
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(1 ) 分 段 线性 化 处 理 的 程序 设计 
中 程序 流程 图 
分 段 线性 化 流程 图 见 图 5-8。 






























获取 当前 像素 
KEAL, j] 








进行 分 段 线性 比 


pre 


图 5-8 分 段 线性 化 流程 图 














(2)DM642 程序 源 代码 
#include < stdio. h > 
#include < stdlib. h > 
#define IMAGEWIDTH 512 
#define IMAGEHEIGHT 350 
#define f0 0 
#define g0 0 
#define fl 50 
#define g1 150 
#define f2 80 
#define g2 250 
#define f3 255 
#define g3 255 
#define Uint8 unsigned char 
void ReadImage( char * cFileName) ; 
void bmpDataPart( FILE * fpbmp) ; 
void Piecewiselinear( ) ; 
#pragma DATA, SECTION( grey," . my, sect" ) 
unsigned char grey[ IMAGEHEIGHT | [ IMAGEWIDTH | ; 
void main( ) 
| 
-—P2] = 
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/* 图 像 */ 
ReadImage("G:\\cargray512. bmp" ) ; 
Piecewiselinear( ) ; 
while (1); 

| 

void ReadImage(char * cFileName) 

| 

FILE * fp; 
if ( fp 2 fopen( cFileName," rb" ) ) 
| 
bmpDataPart( fp) ; 
fclose( fp) ; 


| 
void bmpDataPart( FILE * fpbmp) 
| 
int i, j 20; 
unsigned char * pix = NULL; 
fseek( fpbmp, 1078L, SEEK SET) ; 
pix = ( unsigned char * ) malloc(IMAGEWIDTH ) ; 
for(j 0;j «IMAGEHEIGHT;j + +) 
| 
fread( pix, 1, IMAGEWIDTH , fpbmp) ; 
for(i =0;i < IMAGEWIDTH i + + ) 


| 
| 


grey[ IMAGEHEIGHT-1-j][i]  -pix[i]; 


| 
i 


void Piecewiselinear( ) 
| 
int i,j; 
unsigned char temp; 
double rl ,12,:3; 
double bl ,b2 ,b3 ; 
rl 2 (gl - g0)/(fl - $0); 
bl =g0 -rl * 0; 
r2 2(g2-gl)/(£2 -fl); 
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b2 =gl -r2 * fl; 
13 = (g3. g2)/ (6:2); 
b3 =g2 -r3 * f2; 
for(i =0;i < IMAGEHEIGHT;i + +) 
| 
for(j 20;j «IMAGEWIDTH;j + +) 
| 
temp = grey[ i] [j]; 
if( temp <f1) 
| 
grey[ i] [j] 2 rl * temp + bl ; 


if( (temp > 2f1) && (temp « £2) ) 
grey[i][j] 212 * temp +b2; 


if( (temp > 2f2) && (temp < =f3)) 





grey[ i][j) 213 * temp + b3; 


| 

@CCS 仿真 设置 

选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗口 ,右键 单 击 图 像 窗 口 选择 Proper- 
ties 进行 图 像 显 示 配 置 ,如 图 $-9 所 示 。 





I cava E ww 
(mreeüoRemMen — 8 à 0 CIE 7-5 
Property Value | 
4 General | 
Title 1 
Background color RGB (255, 255, 255} | 
Imege format RGB | 
4 RGB | 
Number of pixels per line 512 | 
Number of lines 350 i 
j Data format Planar | 
| Pixel stride (bytes) 1 | 
Red mask OxFF | 
| Green mask OxFF | 
Blue mask OxFF | 
Alpha mask (if any) 0x00 i 
Line stride (bytes) 512 | 
Jmage source Connected Device | 
Red start address grey i 
| Green start address grey | 
| Blue start address grey H 
| Pha start address Gif any) ^ > E | 
| Read data as 8 bit data | 
| 
i 


图 5-9 CCS 图 像 查看 设置 
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(9 实验 结果 
分 段 线性 化 处 理 的 CCS 实验 结果 如 图 5-10 所 示 。 





a) 原始 图 像 b) 处 理 结果 
图 5-10 “分 段 线性 化 处 理 结果 
(2) 指 数 变换 的 程序 设计 
程序 流程 图 
指数 变换 的 流程 见 图 5-11. 



























































图 5-11 指数 变换 流程 图 
(22DM642 程序 源 代码 
#include < stdio. h > 
#include < math. h > 
#include < stdlib. h > 
#define IMAGEWIDTH 512 
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#define IMAGEHEIGHT 350 

#define a 2 

zdefine b 1.4 

#define c 0.1 

#define Uint8 | unsigned char 

void ReadImage( char. * cFileName ) ; 

void bmpDataPart( FILE * / fpbmp) ; 

void ExponentialTransform( ) ; 

#pragma DATA. SECTION( grey," . my, sect" ) 


unsigned char grey[ IMAGEHEIGHT |  IMAGEWIDTH | ; 


void main( ) 
| 
/* 图 像 */ 
ReadImage ( " G ; \\cargray512c. bmp" ) ; 
ExponentialTransform( ) ; 
while (1); 
| 
void Readlmage( char * cFileName) 
| 
FILE *fp; 
if ( fp=fopen(cFileName,"rb" ) ) 
| 
bmpDataPart(fp ) ; 
fclose( fp) ; 


| 
void bmpDataPart( FILE * fpbmp) 
| 
int i, j 20; 
unsigned char * pix = NULL; 
fseek (fpbmp, 1078L, SEEK SET) ; 
pix = (unsigned char * ) malloc(IMAGEWIDTH ) ; 
for(j 20;j «IMAGEHEIGHT;j + +) 
| 
fread( pix, 1, IMAGEWIDTH , fpbmp) ; 
for(i =0;i e IMAGEWIDTH zi + +) 
| 
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grey[ IMAGEHEIGHT -1-j][i] =pix[i]; 


| 
Í 


void ExponentialTransform( ) 
int m,n; 
double temp; 
for( m =0;m < IMAGEHEIGHT ; m + +) 


| 
for(n =0;n < IMAGEWIDTH ;n + +) 


temp = grey| m] [ n] ; 
grey| m][n] =exp((c * (temp-a)) *log(b)) -1; 


ccs 仿真 设置 

选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗 口 ,右键 单 击 图 像 窗口 选择 Proper- 
ties 进行 图 像 显 示 配 置 ,设置 如 图 5-9 所 示 。 

由 实验 结果 

指数 变换 实验 结果 见 图 5-12, 





a) 原始 图 像 b) 处 理 结果 


图 5-12 指数 变换 实验 结 


(3) 对 数 变换 的 程序 设计 

(DD 程序 流程 图 

对 数 变 换 流程 见 图 5-13. 
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图 5-13 ”对 数 变 换 流程 图 
(2)DM642 程序 源 代码 
#include < stdio. h > 
#include < math. h > 
#include < stdlib. h > 
#define IMAGEWIDTH 512 
#define IMAGEHEIGHT 350 
#define a 200 
#define b 0. 03 
#define c 0.2 
#define Uint8 | unsigned char 
void ReadImage( char * cFileName) ; 
void bmpDataPart( FILE * fpbmp) ; 
void LogarithmiTransformation( ) ; 
Spragma DATA. SECTION( grey," . my, sect" ) 
unsigned char grey[ IMAGEHEIGHT | | IMAGEWIDTH | ; 
void main( ) 
| 
/* 图 像 */ 
ReadImage(" G; \\cargray512b. bmp" ) ; 
LogarithmiTransformation ( ) ; 
while (1); 
| 
void ReadImage(char * cFileName ) 


第 5 章 图 像 增强 


== y = 


图 像 处 理 与 机 器 视觉 


| 

FILE * fp; 
if ( fp = fopen( cFileName," rb" ) ) 
| 
bmpDataPart( fp) ; 


fclose ( fp) ; 


void bmpDataPart( FILE * fpbmp) 


int i, j 20; 
unsigned char * pix = NULL; 
fseek( fpbmp, 1078L, SEEK SET) ; 
pix = ( unsigned char * ) malloc(IMAGEWIDTH ) ; 
for(j =0;j < IMAGEHEIGHT;j + +) 
| 
fread( pix, 1, IMAGEWIDTH , fpbmp) ; 
for(120;i < IMAGEWIDTH ;i + +) 


| 


[ 
grey[ IMAGEHEIGHT -1 -j][i] =pixli]; 


l 


| 
void LogarithmiTransformation( ) 
| 
int i,j; 
double temp; 
for(i =0;i «IMAGEHEIGHT;i + +) 
| 
for(j =0;j < IMAGEWIDTH;j + +) 
| 
temp = grey[ i][ j] ; 
grey[ il[j] =a+log(temp *1)/(b *log(c)) ; 


(ccs 仿真 设置 
选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗 口 ,右键 单 击 图 像 窗 口 选择 Proper- 
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ties 进行 图 像 显示 配置 ,设置 如 图 5-9 所 示 。 
全 实验 结果 
对 数 变 换 实验 结果 见 图 5-14, 








a) 原始 图 像 b) 处 理 结果 


图 5-14 对 数 变换 处 理 结果 
5.3 直方 图 修正 法 


在 数字 图 像 处 理 中 ,一 个 简单 实用 的 工具 就 是 灰 度 直方 图 , 它 概括 了 一 幅 图 像 的 灰 度 级 内 
容 。 直 方 图 的 计算 是 简单 的 ,特别 是 当 一 幅 图 像 从 一 个 地 方 被 复制 到 另 一 个 地 方 时 ,可 以 用 非 
常 低 的 代价 来 完成 。 

5.3.1 友 度 直方 图 的 定义 


灰 度 直方 图 是 灰 度 级 的 函数 ,描述 图 像 中 具有 该 灰 度 级 的 像素 的 个 数 , 反 映 了 数字 图 像 中 
每 一 灰 度 级 与 其 出 现 频率 之 间 的 统计 关系 。 直 方 图 的 横 坐 标 是 灰 度 级 ,用 > 表示 , 纵 坐标 是 具 
有 该 灰 度 级 的 像素 个 数 或 出 现 这 个 灰 度 级 的 概率 PCr) 


P(N) une (5-7) 


式 中 ,NN 为 一 幅 图 像 中 像素 的 总 数 ;r, 表示 灰 度 值 为 的 灰 度 级 ;ni 为 第 r, 级 灰 度 的 像素 
数 ;P(r,) 表 示 该 灰 度 级 出 现 的 概率 。 因 为 P(r) 给 出 了 对 7 出 现 概率 的 一 个 估计 ,所 以 直方 
图 提供 了 原 图 的 灰 度 值 分 布 情况 ,也 就 是 给 出 了 一 幅 图 所 有 灰 度 值 的 整体 描述 。 图 5-15 给 出 
了 图 像 的 直方 图 。 

从 直方 图 可 以 看 出 图 像 的 许多 一 般 特 性 。 在 图 5-16b) 所 示 的 直方 图 中 ,由 于 大 部 分 灰 度 
集中 在 暗 区 ,所 以 在 图 像 上 显示 较 暗 。 而 在 图 5-17b) 所 示 的 直方 图 中 ,由 于 它 的 大 部 分 像素 
集中 在 亮 区 ,所 以 在 图 像 上 显示 比较 亮 。 因 此 , 灰 度 直方 图 描述 了 一 幅 图 像 的 概貌 。 

直方 图 能 给 出 该 图 像 的 大 致 描述 ,如 图 像 的 灰 度 范围 灰 度 级 的 分 布 . 整 幅 图 像 的 平均 亮 
度 等 ,但 是 仅 从 直方 图 不 能 完整 地 描述 一 幅 图 像 ,因为 一 幅 图 像 对 应 于 一 个 直方 图 ,但 是 一 个 
直方 图 不 一 定 只 对 应 一 幅 图 像 , 几 幅 图 像 只 要 灰 度 分 布 密度 相同 ,那么 它们 的 直方 图 也 是 相同 
的 。 图 5-18 所 示 就 是 不 同 图 像 内 容 但 具有 相同 直方 图 的 实例 

m o 
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b) 原 图 的 直方 图 


图 5-15 原 图 像 及 其 直方 图 
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a) 较 暗 图 像 b) 较 暗 图 像 的 直方 图 


图 5-16 ” 较 暗 图 像 及 其 直方 图 




















0 50 100 150 200 
a) 较 亮 图 像 b) 较 亮 图 像 的 直方 图 


图 5-17 较 亮 图 像 及 其 直方 图 








5.3.2 和 直方 图 的 用 途 
灰 度 直方 图 的 用 途 主 要 有 数字 化 参数 Y PIE BRL 综合 光 密度 
zu 








。 具 体 如 下 、 
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M 





第 5 章 图 像 增强 


mmj "ab 





























a) 图 像 1 b) 图 像 2 c) 图 像 3 d) 图 像 4 
a 
0.5 
0.0 73 E - 


e) 以 上 四 幅 图 的 直方 图 
图 5-18 不 同 图 像 对 应 相同 直方 图 实例 

(1) 数 字 化 参数 

直方 图 给 出 了 一 个 简单 可 见 的 指示 ,用 来 判断 一 幅 图 像 是 否 合理 地 利用 了 全 部 被 允许 的 
灰 度 级 范围 。 一 般 一 幅 数 字 图 像 应 该 利用 全 部 或 几乎 全 部 可 能 的 灰 度 级 ,否则 就 等 于 增加 了 
量化 间隔 。 一 旦 被 数字 化 图 像 的 灰 度 级 数目 少 于 256 ,丢失 的 信息 (除非 重新 数字 化 ) 将 不 能 

如 果 图 像 具 有 超出 数字 化 所 能 处 理 的 范围 的 亮度 , 则 这 些 灰 度 级 将 被 简单 的 置 为 0 或 
255 ,由 此 将 在 直方 图 的 一 端 或 两 端 产生 尖峰 。 通 过 直方 图 的 快速 检查 ,可 使 数字 化 中 产生 的 
问题 及 早 暴露 出 来 ,以 免 浪 费 大 量 的 时 间 。 





(2) 选 择 边界 浆 值 
假定 一 幅 图 像 的 背景 是 浅 色 的 ,前 景 是 一 个 深 色 的 物体 。 物 体 中 的 深 色 像 素 会 产生 直方 





图 的 左 峰 , 而 背景 中 大 量 的 灰 度 级 会 产生 直方 图 的 右 峰 。 物 体 边界 附近 具有 两 个 峰值 之 间 灰 
度 级 的 像素 数目 相对 较 少 ,从 而 产生 了 两 峰之 间 的 谷 ,此 类 图 像 的 灰 度 直方 图 如 图 5-19 
所 示 。 

在 某 种 意义 上 来 说 ,选择 位 于 两 峰之 间 的 最 低 点 的 | 
灰 度 级 作为 阔 值 来 确定 边界 是 最 适宜 的 。 在 谷底 附近 ， 
直方 图 的 值 相对 较 小 。 如 果 我 们 选择 谷底 处 的 灰 度 作为 
国 值 ,将 可 以 使 其 对 物体 边界 的 影响 达到 最 小 , 且 图 像 较 
亮 的 背景 区 域 和 较 暗 的 前 景区 域 可 以 较 好 地 分 离 ,可 以 
得 到 较 好 地 二 值 化 处 理 效 果 。 

(3) 综 合 光 密度 (10D) 














—L 
r 


综合 光 密 度 是 反映 图 像 * 质 量 ” 的 一 种 有 用 度量 ,其 0 71 
EXN: 图 5-19 ” 双 峰 直方 图 
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10D = [| fs drdy (5-8) 


其 中 ,a f b 是 所 划 定 的 图 像 区 域 的 边界 。 
对 于 数字 图 像 ,有 : 


10D =Ù È f(i,j) (59) 


其 中 ,f(i,j) 是 像素 (i,j) 的 灰 度 值 。 令 N, 代表 灰 度 级 为 时 所 对 应 的 像素 的 个 数 。 则 
式 (5-9) 可 以 改写 为 : 


255 
IOD = XEN, (5-10) 


显然 ,该 公式 是 将 一 幅 图 像 内 所 有 的 灰 度 级 加 起 来 。 然 而 ,只 是 灰 度 级 所 对 应 的 直方 图 上 
的 值 , 故 上 式 可 以 改写 为 : 


255 
10D = X kh,(r,) (5-11) 


即 灰 度 级 加 权 的 直方 图 之 和 。 

5.3.3 直方 图 均衡 化 

直方 图 均衡 化 就 是 把 原始 图 像 的 直方 图 变换 成 均匀 分 布 的 形式 ,这 样 增加 了 像素 灰 度 值 
的 动态 范围 ,从 而 达到 增强 图 像 整体 对 比 度 的 效果 。 

直方 图 均衡 方法 的 基本 思想 是 对 在 图 像 中 像素 个 数 多 的 灰 度 级 进行 展 宽 , 而 对 像素 个 数 
少 的 灰 度 级 进行 缩减 ,将 灰 度 的 范围 拉 开 , 从 而 达到 清晰 图 像 的 目的 。 通 过 点 运算 使 输入 图 像 
转换 为 在 每 一 灰 度 级 上 都 有 像素 点 的 数目 , 即 让 灰 度 直方 图 在 较 大 的 动态 范围 内 趋 于 一 致 。 
这 对 于 在 进行 图 像 比较 和 分 割 之 前 将 图 像 转 化 为 一 致 的 格式 是 十 分 有 益 的 。 

为 了 研究 方便 ,用 r 和 分 别 表示 归 一 化 的 原始 图 像 灰 度 和 变换 后 的 图 像 灰 度 , 即 0<r=< 
1,0€ssx1(0 代表 黑 ,1 代表 白 ) 。 

在 [0,1] 区 间 内 的 任 一 个 r 值 ,都 可 以 产生 一 个 * 值 , 且 s=7T(Cr) ,7T(7) 为 变换 函数 。 为 使 
这 种 灰 度 具有 实际 意义 ,T(r) 应 满足 下 列 条 件 : 

(1) 在 0<r<1 区 间 ,7(7) 为 单调 递增 函数 ; 

(2) 在 0<r<1 区 间 , 有 0<7(r) «1, 

这 里 ,条 件 (1) 保 证 灰 度 级 从 黑 到 白 的 次 序 , 条 件 (2) 保证 变换 后 的 像素 灰 度 仍 在 原来 的 
动态 范围 内 。 

由 于 s 和 7 的 反 变 换 为 


rzT'(s) (0<s<1) (5-12) 
XE T (s) 对 * 也 满足 条 件 (1) 和 (2) 。 
由 概率 论 可 知 , 若 原 图 像 灰 度 级 的 概率 密度 函数 P, (n) 和 变换 函数 7(7r) 已 知 , 且 T (s) 
是 单调 增加 函数 , 则 变换 后 的 图 像 灰 度 级 的 概率 密度 函数 已 (>) 如 下 式 所 示 : 
n 
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P5) e PS leas (5-13) 
对 于 连续 图 像 , 当 直方 图 均衡 化 (并 归 一 化 ) 后 有 P, (s) =1, 即 
ds 2 P.(r)dr 2 dT(r) (5-14) 
两 边 取 积分 可 得 式 (5-15 ) ; 
s = T(r) = | PCr)dr (5-15) 


XX 5-15) BU BroR BIZE H PRA, E K 91 205 e pU: Tt PEE B SHE PRU, Je — I ME ffo P8 
对 于 离散 图 像 ,假定 数字 图 像 中 的 总 像素 为 N 个 , 灰 度 级 总 数 为 工 个 ,rm 表示 灰 度 值 为 上 
的 灰 度 级 ,mi 为 第 r, 级 灰 度 的 像素 数 , 则 该 图 像 中 灰 度 级 r, 的 像素 出 现 的 概率 为 


AO [Uu e en diee Ey (5-16) 


对 其 进行 均匀 化 处 理 的 变换 函数 为 


s, 7 TCr,) 2 lx (5-17) 
相应 的 逆 变 换 函 数 为 
maT "DE (0zs, x1) (5-18) 


[81531] 直方 图 均衡 计算 实例 
假设 有 一 幅 图 像 ,共有 64 x 64 个 像素 ,8 个 灰 度 级 ,各 灰 度 级 概率 分 布 见 表 5-1 ,将 其 直方 
图 均衡 化 。 


各 灰 度 级 概率 分 布 ( V =4096) x 5-1 











解 :根据 表 5-1 做 出 的 此 图 像 直方 图 如 图 5-20 所 示 , 应 用 式 (5-17) TREER RAN 
s e TG) = XP.) =P(n) =0. 19 


1 
s Tr) = XP, (r;) zP,(ry) * P,(r,) 20.19 +0. 25 =0. 44 


按 此 同样 的 方法 计算 出 ss ss uses; WTF: 
$,70.65 — 5,20.95 520.81 520.98 520.89 = 
图 5-20c) AET s, 5 r, 之 间 的 曲线 ,根据 变换 函数 TC n, ) 可 以 逐个 将 m 变 成 % ,从 表 5-1 
中 可 以 看 出 原 图 像 给 定 的 7 是 等 间隔 的 , 即 在 0.1X7、2/7 371 471 5/76/71 和 1 中 取 值 ,而 经 
过 7T(r,) 求 得 的 s, 就 不 一 定 再 是 等 间隔 的 ,从 图 5-20c) 中 可 以 明显 看 出 这 一 点 , 表 5-2 中 列 出 
了 重新 量化 后 得 到 的 新 灰 度 $0 si ss! s/o 
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a) 原始 直方 图 b) 均衡 化 后 的 直方 图 
Ssa T(r) 
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20 4n" 6" 1 r, 
c) 变换 函数 
图 5-20 155-1 的 直方 图 均衡 化 
直方 图 均衡 化 过 程 表 5-2 









新 灰 度 级 分 布 











656 3/7 =0.43 s1(1023) 


790/4096 =0.19 








T(r3) =s; =0. 81 1023/4096 =0. 25 















T(r,) =s4 =0. 89 4/1 =0.57 


T(rs) =ss =0.95 245 5/7 =0.71 s4 (850) 
T(re) =s6 =0. 98 6/7 =0.86 s4 (985) 


把 计算 出 来 的 % 与 量化 级 数 相 比较 , 可 以 得 出 : 


1 3 5 6 
3o =0. 19 一 本 s$] 三 个: 447 5 = 657s; zi). 8177. 








850/4096 - 0.21 











985/4096 - 0.24 





448/4096 =0. 11 


$4 2:0. 8925s z0. 95—1 ,s, 20. 981,5, 2 1—1 


由 上 可 知 ,经 过 变换 后 的 灰 度 级 不 再 需要 8 个 ,而 只 需要 5 个 ,它们 是 
sd y esso ape 


^S NL. E mug ende pm m 'a] 
$74.52 —7754.4$839773,.8,— 


-07 7 7 7 
把 相应 原 灰 度 级 的 像素 相 加 就 得 到 新 灰 度 级 的 像素 数 。 均 衡 化 以 后 的 直方 图 如 图 5-5b) 
所 示 ,从 图 中 可 以 看 出 均衡 化 并 不 能 完全 均匀 ,这 是 由 于 在 均衡 化 过 程 中 , 原 直方 图 上 有 几 个 
— 
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像素 较 少 的 灰 度 级 合并 到 一 个 新 的 灰 度 级 上 , 而 像素 较 多 的 灰 度 级 间隔 被 拉 大 了 。 

虽然 直方 图 均衡 化 能 提高 图 像 对 比 度 ,但 它 是 以 减少 图 像 的 灰 度 等 级 为 代价 的 。 在 均衡 
化 的 过 程 中 , 原 直方 图 上 图 像 灰 度 级 r,、r, 合成 了 一 个 灰 度 级 , 灰 度 级 rs rers 合成 了 一 个 灰 
度 级 ;;。 可 以 理解 , 原 图 像 中 灰 度 级 7,\r, 之 间 , 以 及 rs\re vr; 之 间 的 图 像 细 节 经 均匀 化 以 后 ， 
完全 损失 掉 了 ,如 果 这 些 细节 很 重要 ,就 会 导致 不 良 结果 。 为 把 这 种 不 良 结果 降低 到 最 低 限 
度 ,同时 又 可 提高 图 像 的 对 比 度 , 可 以 采用 局 部 直方 图 均衡 化 的 方法 。 如 果 和 希望 得 到 一 个 直方 
图 完全 平均 而 且 灰 度 等 级 又 不 减少 的 均衡 化 处 理 , 则 必须 采用 一 些 拟 合 技术 。 

5.3.4 直方 图 规定 化 

直方 图 均衡 化 能 自动 地 确定 变换 函数 ,可 以 寻求 有 均匀 直方 图 的 输出 图 像 。 采 用 这 种 技 
术 得 到 的 结果 可 预知 ,并 且 操 作 简单 。 但 它 的 具体 增强 效果 不 易 控 制 , 处 理 的 结果 总 是 得 到 全 
局 均衡 化 的 直方 图 。 男 外 ,均衡 化 处 理 后 的 图 像 虽 然 增强 了 图 像 的 对 比 度 ,但 并 不 一 定 符合 人 
的 视觉 特性 。 在 实际 应 用 中 ,有 时 需要 指定 处 理 的 图 像 具 有 和 希望 的 直方 图 形状 。 这 种 产生 特 
殊 直 方 图 的 方法 ,叫做 直方 图 匹配 或 直方 图 规定 化 。 直 方 图 规定 化 是 对 直方 图 均衡 化 方法 的 
改进 , 见 图 5-21。 

P, (ry) 
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i7 37 Sn 1 Zh 
b) 预期 的 直方 图 
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c) 变换 函数 d) 结 果 直 方 图 


图 5-21 直方 图 规定 化 


下 面具 体 介绍 如 何 实 现 直 方 图 规定 化 处 理 。 先 讨论 连续 的 情况 : 设 P, Cr) A P,(z) 分 别 代 
表 原 始 图 像 和 规定 化 处 理 后 图 像 的 灰 度 概率 密度 函数 ,分 别 对 原始 直方 图 和 规定 化 处 理 后 的 
直方 图 进行 均衡 化 处 理 , 则 有 


SUE [Pid (5-19) 
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图 像 处 理 与 机 器 视觉 
v = 6C(z) = | P,(2)dz (5-20) 
sec a) (521) 


均衡 化 处 理 后 ,理论 上 二 者 所 获得 的 图 像 灰 度 概 率 密度 函数 P (s) RU. P,(v) 应 该 是 相等 
的 ,因此 可 以 用 s 代替 式 (5-21) 中 的 w 即 


z=C-(s) (5-22) 


这 里 灰 度 级 z 便 是 所 求 得 的 直方 图 规定 化 图 像 的 灰 度 级 。 
此 外 ,利用 式 (5-19 ) 和 式 (5-20) 还 可 得 到 组 合 变换 函数 ,可 以 获得 希望 的 图 像 灰 度 级 。 


z-6^ [T(r)] (5-23) 
对 于 连续 图 像 ,重要 的 是 给 出 道 变换 解析 式 。 对 于 离散 图 像 而 言 ,有 


P,(z,) z (5-24) 
v= G( 4) « Pia) (5-25) 
0 (5,) =G ae] (5-26) 
下 面 仍 以 例 5-1 的 图 像 为 例 , 说 明 直 方 图 规定 化 增强 的 过 程 。 计 算 过 程 如 表 5-3 所 示 。 
直方 图 规定 化 增强 的 计算 过 程 表 5-3 
EE tse 











urs | 019 | 0.44 | 0.65 | o8 | os | 0.95 | 0.98 | 1.00 
规定 化 直方 图 | 4& | 0 0 0.15 | 6.20 | 06.30 | 0.20 | 0.15 








规定 化 累计 直方 图 EEUU RERUM 0.15 | 06.35 | 0.65 | 0.85 | 1.00 
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表 中 原始 直方 图 各 灰 度 级 像素 为 为 P(r) ,原始 累计 直方 图 为 % ,规定 化 直 
方 图 为 P(z) ,规定 化 累计 直方 图 为 w ,映射 最 小 即 求 1% -内 1 最 小 ,以 上 具体 步骤 如 下 : 

CL) 执行 均衡 化 过 程 ,8 个 灰 度 级 并 为 5 个 灰 度 级 ; 

(2) 对 规定 化 的 图 像 用 同样 的 方法 进行 直方 图 均衡 化 处 理 , 如 式 (5-25 ) ; 

(3) 使 用 与 v 靠近 的 s, 代替 六 ,并 用 G^ (s) GREATER BU RTT] z; 

(4) 图 像 总 像素 点 为 64 x 64 - 4096 , 18:3 — RI] z SR HUBER P (z,) ,其 结果 如 图 5-21d) 
所 示 。 


5.3.5 ”直方 图 修正 法 的 实现 
在 本 节 中 将 结合 上 述 的 理论 ,分 别 给 出 具体 的 实现 方法 ,设计 基于 Matlab 平台 和 DM642 
= 
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DSP 系统 的 具体 代码 ,可 以 帮助 读者 深入 了 解 线性 变换 特点 ,掌握 其 实现 过 程 。 

1. Matlab 仿真 实现 

(1) 直方 均衡 化 M 文件 源 代 码 及 仿真 结果 

Matlab 图 像 处 理工 具 箱 提供 了 imhist 函数 来 计算 和 显示 图 像 的 直方 图 ,并 且 提 供 了 用 于 
直方 图 均衡 化 的 处 理 函 数 histeq ,根据 这 两 个 函数 我 们 的 代码 如 下 : 

I = imread ( 'D; \Administrator \My Pictures VcarVBcargray512. bmp) ; 

J =histeq( I) ; 

subplot(2 ,2 ,1 ) ,imshow(I) 

title( 'a) ( 偏 暗 图 像 ) ; 

subplot(2,2,2) ,imshow( J) 

title(b) (均衡 化 处 理 后 图 像 ') ; 

subplot(2 ,2,3) ,imhist(I) 

title('c)( 偏 暗 图 像 直 方 图 ') ; 

subplot(2,2 ,4) , imhist( J) 

title('d) (均衡 化 后 直方 图 '); 

直方 图 均衡 化 结果 如 图 5-22 所 示 。 根 据 实验 结果 可 以 看 出 ,图 5-22a) 原 图 较 暗 且 动 态 范围 
较 小 ,反映 在 直方 图 中 灰 度 级 范围 窗 ,而 且 集中 在 低 灰 度 值 一 边 ,如 图 5-22b) 所 示 。 图 5222c) 








0 100 200 
a) 原始 偏 暗 图 像 b) 偏 暗 图 像 的 直方 图 





“加 均衡 化 后 M d) 均 衡 化 后 的 直方 图 
图 5-22 ”直方 图 均衡 化 
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和 图 5-224) 是 经 过 直方 图 均衡 化 处 理 后 的 图 像 和 直方 图 ,处 理 后 的 图 像 直方 图 分 布 比较 均 
名 ,占据 了 整个 图 像 灰 度 值 允许 的 范围 。 因 此 ,经 过 直方 图 均衡 化 处 理 后 增加 了 图 像 灰 度 的 动 
态 范 围 ,也 增加 了 原 图 像 的 对 比 度 。 但 需要 注意 的 是 ,直方 图 均衡 化 在 增加 图 像 对 比 度 的 同 
时 ,也 增加 了 图 像 的 颗粒 感 。 

(2) 直方 规定 化 的 M 文件 源 代码 及 仿真 结果 

直方 图 规定 化 结果 如 图 5-23 所 示 ,此 程序 中 我 们 使 用 图 5-22a) 均衡 化 为 32 个 灰 度 级 的 
直方 图 作为 期 望 直 方 图 ,将 一 张 较 亮 的 图 像 进行 规定 化 处 理 。 











图 5-23 直方 图 规定 化 


I = imread( 'D; VAdministratorVMy Pictures \car\Bcargray512. bmp!) ; 
J = histeq( 1,32) ; 

[ counts,x] = imhist( J); 

Q = imread( 'D; \ Administrator \My Pictures VcarM.cargray512. bmp!) ; 
figure, 

subplot(2,2,1) ,imshow( Q); 

title('a) ( 较 亮 图 像 ) ; 

subplot(2,2 ,3) ,imhist(Q ) ; 

title( b) ( 较 亮 图 像 直方 图 ) ; 

M =histeq(Q,counts ) ; 

subplot(2,2,2) ,imshow( M) ; 

title('c) (规定 化 处 理 后 图 像 ) ; 

subplot(2,2,4) ,imhist(M ) ; 

tite('d) (规定 化 处 理 后 直方 图 ') ; 
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2. DM642 DSP 系统 的 算法 实现 


本 节 基 于 TMS320DM642 平台 ,给 出 了 直方 图 均衡 化 和 规定 化 算法 的 C 语言 实现 。 
(1) 直 方 图 均衡 化 实现 

@D 程 序 流程 图 

直方 图 均衡 化 流程 见 图 5-24。 










变量 定义 及 初始 化 


统计 各 灰 度 级 像素 数 Mi 


计算 原始 图 像 直 方 图 
P(i) -N/N 


计算 累计 直方 图 
计算 变换 后 的 灰 度 值 


a) 整体 流程 图 b) HistogramAverage 函 数 流程 图 
图 5-24 程序 流程 图 


























Q@DM642 程序 源 代码 
#include < stdio. h > 
#include < stdlib. h > 
#define IMAGEWIDTH 512 
#define IMAGEHEIGHT 350 
#define Uchar unsigned char 
void ReadImage( char * cFileName) ; 
void bmpDataPart( FILE * fpbmp) ; 
void HistogramAverage( ) ; 
#pragma DATA, SECTION( graynew , " . my, sect" ) 
Uchar grayold[ IMAGEHEIGHT | [ IMAGEWIDTH | ; 
Uchar graynew[ IMAGEHEIGHT | [ IMAGEWIDTH | ; 
void main( ) 
| 

/* 图 像 */ 

ReadImage("D:\\Administrator\\My Pictures \\car\ \Bcargray512. bmp" ) ; 
/* 灰 度 直方 图 均衡 化 */ 
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HistogramAverage( ) ; 
| 
void ReadImage(char * cFileName ) 
| 
FILE * fp; 
if ( fp 2 fopen( cFileName," rb" ) ) 
| 
bmpDataPart( fp ) ; 
fclose( fp) ; 


| 
Í 


void bmpDataPart( FILE * fpbmp) 
| 

int 1, j 20; 

Uchar * pix = NULL; 

fseek ( fpbmp, 1078L, SEEK. SET) ; 

pix = ( Uchar * ) malloc(512) ; 

for(j =0;j «IMAGEHEIGHT;j + +) 

| 

fread( pix, 1, 512, fpbmp) ; 

for(i =0;i < IMAGEWIDTH ;i + +) 


| 
| 


grayold[ IMAGEHEIGHT -1 -j][i] =pixli]; 


/ * 直方 图 均衡 */ 
void HistogramAverage( ) 
| 
int L 2256; 
int wii 
float p[256] = {0} ,c[256] = {0} ,number[256] = 10.0}; 
for(i =0;i < IMAGEHEIGHT;i + +) 
| 
for(j =0;j «IMAGEWIDTH;j + +) 


number[ grayold[i][j]] + +; 
Suie- 
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| 
f 


for(i=0;i<L;i+ *)| 
pli] =number[ i]/( IMAGEHEIGHT * IMAGEWIDTH ) ; 
| 
for(1=0;i<L;i+ +) 
| 


l 


for( j z0;j « zz. + +) 


for(i =0;i < IMAGEHEIGHT;i + +) 


| 
l 


for(j =0;j «IMAGEWIDTH;j + + ) 


| 
| 


graynew[i][j] = (int) (Ce[ grayold[ i][j] |] * 255.0 40.5); 


(CCS 仿真 设置 

选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗 口 ,右键 单 击 图 像 窗 口 选择 Proper- 
ties 进行 图 像 显 示 配 置 , 设 置 与 第 5.2.3 节 中 图 5-9 相同 。 

@ 实 验 结果 

以 上 代码 以 HistogramAverage ( ) 函数 对 一 张 较 暗 图 像 进 行 处 理 , 实 验 结 果 如 图 5-25 所 示 。 


6 Ccs ibug Ps 7 Code Compeser Studi ew 





a) 处 理 前 较 暗 图 像 。 世 直 方 图 均衡 化 处 理 后 图 像 
图 525 ”直方 图 均衡 化 处 理 

(2) 直方 图 规定 化 的 实现 

CD FF MIERI 

EO ee 


人 


直方 图 规定 化 流程 见 图 5-26, 









变量 定义 及 初始 化 
对 原 图 像 作 直 方 图 
均衡 化 
对 规定 的 直方 图 
均衡 化 处 理 
计算 两 者 累计 
直方 图 之 差 
确定 映射 关系 


根据 映射 关系 得 到 
新 像素 灰 度 


图 5-26 直方 图 规定 化 流程 图 


(22DM642 程序 源 代码 

本 程序 中 ,选择 一 副 较 暗 的 图 像 进 行规 定 化 处 理 ,为 了 使 处 理 结果 显而易见 ,我 们 选择 一 
个 灰 度 集中 在 亮 区 的 直方 图 作为 目标 直方 图 , 即 较 暗 图 像 经 过 规定 化 处 理 后 将 会 变 为 一 幅 较 
亮 的 图 像 , 灰 度 直 方 图 规定 化 代码 清单 如 下 : 

#include < stdio. h > 

#include < stdlib. h > 

#define IMAGEWIDTH 512 

#define IMAGEHEIGHT 350 

#define Uchar unsigned char 

void ReadImage( char * cFileName) ; 

void bmpDataPart( FILE * fpbmp) ; 

void HistogramSpecification( ) ; 

#pragma DATA, SECTION( srcMin , " . my, sect" ) 

Uchar grey[ IMAGEHEIGHT | | IMAGEWIDTH | ; 

float srcMin[ IMAGEHEIGHT |  IMAGEWIDTH | ; 

void main( ) 

| 
— 142 一 


第 5 章 图 像 增强 


/* 图 像 */ 
ReadImage("D:\\Administrator\\My Pictures WV car VM Beargray512. bmp" ) ; 
/* 灰 度 直方 图 规定 化 */ 
HistogramSpecification( ) ; 
while (1) ; 
| 
void ReadImage( char * cFileName ) 
| 
FILE * fp; 
if ( fp 2 fopen( cFileName," rb" ) ) 
| 
bmpDataPart( fp) ; 
fclose(fp) ; 


| 
void bmpDataPart( FILE * fpbmp) 
| 
int i, j 20; 
Uchar * pix = NULL; 
fseek ( fpbmp, 1078L, SEEK SET) ; 
pix = ( Uchar * ) malloc(512) ; 
for(j 20;j «IMAGEHEIGHT;j + +) 
| 
fread( pix, 1, 512, fpbmp) ; 
for(i =0;i < IMAGEWIDTH ;i-* +) 
| 
grey[IMAGEHEIGHT -1-j][i] = pix[i]; 


| 
void HistogramSpecification( ) 
| 
int x =0,y =0,endY =0; 
Uchar histMap| 256 | = {0}; 
int L 2256; 
float p[ 256) = {0} ,src[ 256] = {0} ,dst| 256 | = {0} ,number[256] = {0} ,minValue = 0; 
for(x 0;x «IMAGEHEIGHT;x + +) 


| 
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for( y 0;y <IMAGEWIDTH;y+ +) 
| : 
number[ grey[ x]| y] ] + +; 
| 
| 
for(x=0;x<L;x+ +)| 
p[x] = number[x]/(IMAGEHEIGHT * IMAGEWIDTH); // 归 一 化 的 直方 图 
| 
for(x=0;x «L;x * +) 
for(y =0;y < =x;y + +) 
| 
src[ x] + 2 pL y]; // 累 计 的 归 一 化 直方 图 
dst[ x] + 2 p[255. y]; // Hs ECT 
| 
| 
// 计 算 原始 图 像 到 目标 图 像 累积 直方 图 各 灰 度 级 的 差 的 绝对 值 
for (y = 0; y < IMAGEHEIGHT; y+ +) 
| 
for (x = 0; x < IMAGEWIDTH; x+ +) 
| 
srcMin| y][x] =srcLy] - dst[x]; 
if( ssrcMin[ y ][ x] <0) 
srcMin| y][x] = - sreMin[ y ][ x]; 
| 
| 
//GML 映射 
for (x = 0; x <IMAGEHEIGHT ; x+ +) 
| 
minValue = srcMin[x] [0]; 
for (y = 0;y < IMAGEWIDTH; y+ +) 
| 
if (minValue > sreMin[ x][ y]) 
| 
endY = y; 
minValue = sreMin[x]| y]; 


Md 
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histMap[x] = endY;// 建 立 映射 关 系 

| 

// 根 据 映 射 得 到 新 的 像素 点 

for (x = 0; x < IMAGEHEIGHT; x+ +) 
for (y = 0; y < IMAGEWIDTH ; y+ +) 
grey[x][y] = histMap[ grey[x][y]]; 


f 
3 实验 结果 











实验 结果 如 图 5-27 所 示 , 由 实验 结果 可 以 明显 看 出 直方 图 规定 化 后 的 图 像 符合 预期 结果 。 
eR 
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O eRHHHNBERO 。 直方 图 规定 化 处 理 后 图 像 


图 5-27 直方 图 规定 化 处 理 


5.4 BIGGER 


在 图 像 的 获取 和 传输 过 程 中 原始 图 像 会 受到 各 种 噪声 的 干扰 ,包括 光电 转换 过 程 中 的 噪 
声 , 照 片 颗 粒 噪声 和 通信 传输 中 的 误差 等 ,使 图 像 质 量 下 降 , 为 后 续 的 图 像 处 理 与 分 析 造 成 了 
障碍 。 噪 声 反映 在 图 像 中 ,会 使 原本 均匀 和 连续 变化 的 灰 度 值 突然 变 大 或 变 小 ,形成 一 些 虚假 
的 边缘 或 轮廓 。 减 弱 、 抑 制 或 消除 噪声 而 改善 图 像 质量 的 方法 称 为 图 像 平滑 。 图 像 平 滑 有 两 
个 方面 内 容 , 一 是 消除 噪声 ,二 是 增强 (或 保护 ) 图 像 特征 。 在 实际 中 这 两 点 也 总 是 结合 在 一 
起 ,需要 良好 的 兼顾 。 平 滑 方 法 一 般 可 分 为 两 大 类 , 即 空间 域 方法 和 频率 域 方法 。 空 间 域 常 用 
的 方法 有 邻 域 平均 法 .中 值 滤波 和 多 图 像 平均 法 等 ;在 频率 域 ,因为 噪声 频谱 多 在 高 频段 ,因此 
可 以 采用 各 种 形式 的 低 通 滤波 方法 进行 平滑 处 理 。 

5.4.1 MRLJA 

邻 域 平均 法 是 最 简单 的 空间 域 平滑 方法 ,属于 线性 低 通 滤波 器 。 基 本 思想 是 通过 某 一 点 和 
邻 域内 像素 点 求 平均 来 去 除 突变 的 像素 点 ,从 而 滤 掉 了 一 定 的 噪声 ,主要 优点 是 算法 简单 ,计算 
速度 快 。 缺 点 是 图 像 在 一 定 程度 上 会 出 现 模糊 。 邻 域 平 均 法 的 平滑 效果 与 所 采用 的 模板 的 大 小 
有 关 , 半 径 越 大 , 则 图 像 的 模糊 程度 就 越 大 。 具 体操 作 时 利用 几 个 像素 灰 度 的 平均 值 代替 每 个 像 
素 的 灰 度 。 假 设 一 幅 N x NN 个 像素 的 图 像 (x,y) ,平滑 处 理 后 得 到 一 幅 图 像 g(x,y) , 则 有 


g(%,y) = 五 E fy) (527) 
odds 
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其 中 ,x,y =0,1,2,…,M-1;S 是 (x,y) 点 邻 域 重点 坐标 的 集合 ,但 其 中 不 包括 (x,y) 点 ;M 
是 集合 内 坐标 点 的 总 数 。 式 (5-27) 表 明 ,平滑 后 的 图 像 z(x,y) 中 的 每 个 像素 的 灰 度 值 均 由 包 
含 在 (x,y) 点 的 预定 领域 中 的 f(x,y) 的 几 个 像素 灰 度 值 的 平均 值 来 确定 。 它 是 典型 的 局 部 平 
均 , 以 减少 边缘 的 影响 。 
邻 域 S 的 形状 和 大 小 根据 图 像 特 点 确定 。 一 般 取 的 形状 是 正方 形 矩形 及 十 字形 等 ,$ 的 
形状 和 大 小 可 以 在 全 图 处 理 过 程 中 保持 不 变 , 也 可 根据 图 像 的 局 部 统计 特性 而 变化 。 
邻 域 平均 法 可 以 去 除 一 定 程度 的 椒盐 噪声 和 高 斯 噪声 ,处 理 后 的 图 像 噪声 会 减弱 。 但 是 , 原 
图 像 经 过 邻 域 平均 法 处 理 后 ,本 来 清晰 的 边缘 会 变 模 糊 。 这 是 因为 邻 域 平均 法 一 视 同仁 地 对 图 
像 中 所 有 的 区 域 都 进行 了 均值 蔡 换 , 缺 乏 对 图 像 中 目标 边缘 信息 的 保护 。 当 使 用 邻 域 平均 时 ,图 
像 中 本 可 能 是 有 效 边缘 的 突出 点 也 会 被 平滑 , 目标 的 边缘 会 变 得 模糊 不 清 ,而 且 这 种 模糊 边缘 的 
效果 会 随 着 平滑 窗口 的 增 大 而 越发 明显 ,因此 对 于 边缘 信息 的 破坏 是 该 算法 的 缺点 。 
为 了 减少 这 种 效应 可 以 采用 立 值 法 ,也 就 是 根据 下 列 准则 形成 图 像 。 
h(x,y) = nr fy) -a X FG > 
f(x,y) else 
KP, EE TEER, Bi EX np, 24 39 DNI o3 065 35 (L5 RRR 25 (EUNT 2T 
EBH T( |f(x,y) - M^! X faa) | > T 的 对 立 情况 ) 时 ,这 些 点 的 像素 灰 度 值 (x,y) 仍 然 
不 变 。 经 过 盖 值 处 理 后 的 图 像 比 采用 前 面 的 直接 图 像 令 域 平均 法 公式 的 模糊 度 要 小 一 些 。 其 
原理 很 明显 ,主要 是 利用 噪声 点 的 灰 度 值 与 其 邻 域 点 灰 度 的 均值 差异 很 大 这 一 特点 。 当 邻 域 
内 点 的 均值 与 该 点 的 差 值 很 大 时 , 它 是 噪声 点 的 概率 就 很 大 ,此 时 可 以 用 其 邻 域 平均 值 作为 该 
点 的 灰 度 值 。 这 种 局 部 均值 法 存在 很 多 弊端 ,目前 已 经 出 现 了 很 多 其 他 局 部 平滑 算法 ,可 以 最 
大 程度 的 保留 边缘 细节 。 
假设 将 受到 噪声 干扰 的 图 像 看 成 二 维 随机 变量 ,可 以 利用 统计 理论 来 分 析 受 噪声 干扰 的 
图 像 平 滑 后 的 信 噪 比 问题 。 在 一 般 情 况 下 ,噪声 属于 加 性 噪声 ,并 且 是 独立 的 高 斯 白 噪声 ( 均 
值 为 零 ,方差 为 8 ) ,我 们 定义 信 噪 比 为 含 噪 图 像 的 均值 与 噪声 方差 之 比 , 则 含 噪 图 像 经 邻 域 


平均 法 处 理 后 ,其 信 噪 比 将 提高 V 倍 (W 为 邻 域 中 包含 的 像素 数目 ) ,可 见 邻 域 取得 越 大 , 像 
素 点 越 多 , 信 噪 比 提高 越 多 ,平滑 效果 就 越 好 。 

5.4.2 DAR 

中 值 滤 波 器 是 在 1971 EH J. W. Tukey 首先 提出 并 应 用 在 一 维 信和 号 处 理 技术 中 时 间 序 列 
分 析 , 后 来 应 用 到 二 维 图 像 信 号 处 理 技 术 之 中 。 其 原理 是 ;首先 确定 一 个 以 某 个 像素 为 中 心 点 
的 领域 ,一 般 为 方形 领域 ;然后 将 领域 中 的 各 个 像素 的 灰 度 值 进 行 排序 , 取 其 中 间 值 作为 中 心 
点 像素 灰 度 的 新 值 ,这 里 的 领域 通常 被 称 为 窗口 ; 当 窗 口 在 图 像 中 上 下 左右 进行 移动 后 ,利用 
中 值 滤 波 算法 可 以 很 好 的 对 图 像 进行 平滑 处 理 。 

中 值 滤波 最 初 主要 用 于 一 维 时 间 序 列 分 析 , 后 来 被 用 于 二 维 图 像 处 理 。 中 值 滤波 的 目的 
是 保护 图 像 边 缘 的 同时 去 除 孤 点 噪声 ,能 减弱 或 消除 傅立叶 空间 的 高 频 分 量 ,但 影响 低频 分 
量 。 因 为 高 频 分 量 对 应 图 像 中 的 区 域 边缘 的 灰 度 值 具有 较 大 较 快 变化 的 部 分 ,该 滤波 可 将 这 
些 分 量 滤 除 ,使 图 像 平 滑 。 同 时 ,在 一 定 的 条 件 下 ,可 以 克服 线性 滤波 器 所 带 来 的 图 像 细 节 模 
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糊 ,而 且 对 滤 除 脉冲 干扰 及 图 像 扫描 噪声 非常 有 效 , 但 是 对 一 些 细节 多 ,特别 是 点 、 线 .尖顶 细 
节 较 多 的 图 像 则 不 宜 采用 中 值 滤波 的 方法 。 
1. 中 值 滤 波 的 特性 
(1) 对 某 些 输入 信号 中 值 滤波 的 不 变性 :对 某 些 特定 的 输入 信号 ,滤波 输出 保持 输入 信和 号 
值 不 变 ,例如 在 窗口 2n + 1 内 单调 增加 或 单调 减少 的 序列 , 即 ; 
fuamee-meV x, B OK m aeemE, (5-29) 
则 中 值 滤波 输出 不 变 。 
对 于 阶 牙 信号 ,中 值 滤波 也 保持 不 变 。 
中 值 滤波 的 另 一 类 不 变性 就 是 在 一 维 情况 下 周期 性 的 二 值 序列 。 例 如 
I = +1,+1, -1,-1,+1,+1,-1,—-1,.: 
当 窗 口 为 9 venim 4 的 输入 序列 时 输出 不 变 。 对 于 一 个 二 维 序 
列 , 这 一 类 不 变性 更 为 复杂 ,但 它们 一 般 也 是 二 值 的 周期 性 结构 , 即 周 期 性 网 络 结构 的 图 像 。 
(2) 中 值 滤波 去 噪 性 能 :中 值 滤波 可 以 用 来 减弱 随机 干扰 和 脉冲 干扰 。 由 于 中 值 滤波 是 
非 线性 的 ,因此 随机 输入 信和 号 数学 分 析 比 较 复 杂 。 对 于 均值 为 零 的 正 态 分 布 的 噪声 输入 ,中 值 
滤波 输出 的 噪声 方差 近似 为 : 
CENE E ó; 
Med 一 2 m XN T 
4mP (m) n4 2-1 
式 中 ,6; 为 输入 噪声 功率 (方差 ) ;m 为 中 值 滤波 窗口 长 度 ;m 为 输入 噪声 均值 ;P(m ) 为 品 
声 密 度 函 数 。 而 均值 滤波 的 输出 方差 0) 为 : 
&-L4 (531) 


由 式 (5-31) 可 以 看 出 ,中 值 滤波 的 输出 与 输入 噪声 的 密度 分 布 有 关 。 而 均值 滤波 的 输出 
与 输入 分 布 无 关 。 从 对 随机 噪声 的 抑制 能 力 看 ,中 值 滤波 性 能 要 上 比 均 值 滤 波 差 一 些 。 对 脉冲 
干扰 来 讲 ,特别 是 脉冲 宽度 小 于 m/2 ,相距 较 远 的 窜 脉 冲 干 扰 ,中 值 滤 波 是 很 有 效 的 。 

(3) 中 值 滤波 的 频谱 特性 :由 于 中 值 滤波 是 非 线性 的 ,为 此 在 输入 与 输出 之 间 不 存在 一 一 
对 应 的 关系 ,不 能 用 一 ee orr 应 采用 总 体 试验 观察 方法 。 

设 6 为 输入 信号 频谱 ,F 为 输出 信号 频谱 


T 
urs (5-30) 





(5-32) 


为 中 值 滤 波 器 的 频率 响应 特性 ,H 与 G 有 关 为 ， s 规则 波动 的 曲线 ,其 均值 比较 平坦 。 可 认 
为 经 中 值 滤波 后 ,频谱 基本 不 变 。 这 一 特点 对 从 事 设 计 和 使 用 中 值 滤 波 器 的 工作 是 很 有 意 
义 的 。 

2 en 

设 有 一 维 序列 了 ,f,…,f,, 用 窗口 长 度 为 m(m 为 奇数 ) 的 窗口 对 该 序列 进行 中 值 滤波 ,也 
Jast ,中 相继 抽出 m TC Lue fias EA A A Dmm 
心 值 ,v= = 二 ! 再 将 这 m 个 点 的 值 按 其 数值 大 小 排列 , 取 其 序号 为 正中 间 的 那个 值 作为 滤波 


= = 
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器 的 输出 ,用 以 代替 窗口 中 心 点 的 像素 值 。 用 数学 公式 可 表示 为 
m -1 





Y= Medli oW ieZ,v- 5 (5-33) 
而 均值 滤波 的 一 般 输出 为 . 
z (f, tf ui tr +f + +f) /m iez (5-34) 


例如 :有 一 个 序列 为 10,3 ,4,0,7} , 则 中 值 滤波 为 重新 排序 后 的 序列 10,0,3 ,4,7}+ ,中 间 的 
值 为 3。 若 用 均值 滤波 ,窗口 也 是 取 S ,那么 均值 滤波 输出 为 (0 +3 +4 +0 +7)/5 =2.8。 

3. 二 维 中 值 滤波 

对 于 二 维 图 像 来 说 ,中 值 滤波 的 基本 思想 是 :对 于 一 幅 图 像 ,首先 确定 一 个 以 某 个 像素 为 
中 心 点 的 邻 域 , 一 般 为 方形 邻 域 ;然后 将 邻 域 中 各 个 像素 的 灰 度 值 进行 排序 , 取 其 中 间 值 作为 
中 心 点 像素 灰 度 的 新 值 ,也 就 是 一 个 矩形 滑动 窗口 (窗口 尺寸 一 般 取 奇 数 ) 。 当 窗口 在 图 像 中 
上 下 左右 进行 移动 时 ,利用 中 值 滤波 算法 可 以 很 好 地 对 图 像 进行 平滑 处 理 。 

考虑 到 一 般 图 像 在 两 维 方向 上 均 具 有 相关 性 ,因此 活动 窗口 一 般 选 为 二 维 窗 口 (如 3 x3, 
5 x5 或 7x7 等 ), 这 种 二 维 窗口 可 以 有 各 种 不 同 的 形状 ,如 线 状 、 方 形 、 圆 形 、 十 字形 、 圆 环形 
等 ,常用 窗口 形状 如 图 5-28 所 示 。 
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a) 5x5 方 形 b) 5x5 圆 形 c) 5x5 十 字形 d) 3x3 方 形 
图 5-28 滤波 窗口 示意 图 
中 值 滤波 的 主要 步骤 为 ; 


(1) 将 滤波 模板 (含有 若干 个 点 的 滑动 窗口 ) 在 图 像 中 移动 ,并 将 模板 中 心 与 图 像 中 的 某 
个 像素 位 置 重合 ; 

(2) 读 取 模 板 下 各 对 应 像素 的 灰 度 值 ; 

(3) 将 选取 的 灰 度 值 从 小 到 大 排列 ; 

(4) 找 到 这 一 列 数据 的 中 间 数 据 , 将 其 赋 给 对 应 模板 中 心 位 置 的 像素 。 如 果 窗 口中 有 奇 
数 个 元 素 , 中 值 取 元 素 按 灰 度 值 大 小 排序 后 的 中 间 元 素 灰 度 值 。 如 果 窗 口中 有 偶数 个 元 素 , 中 
值 取 元 素 按 灰 度 值 大 小 排序 后 ,中 间 两 个 元 素 灰 度 的 平均 值 。 因 为 图 像 为 二 维 信号 ,中 值 滤波 
的 窗口 形状 和 尺寸 对 滤波 器 效果 影响 很 大 ,不 同 图 像 内 容 和 不 同 应 用 要 求 往往 选用 不 同 的 窗 
口 形 状 和 尺寸。 

在 实际 使 用 窗口 时 ,窗口 的 尺寸 一 般 先 用 5 x5 ,再 逐渐 增 大 ,直到 其 滤波 效果 满意 为 止 。 
对 于 有 缓 变 较 长 轮廓 线 物 体 的 图 像 ,采用 方形 或 圆 形 窗 口 为 宜 , 对 于 包含 尖顶 角 物 体 的 图 像 ， 
适宜 用 十 字形 窗口 ,使 用 二 维 中 值 滤波 最 值 的 注意 的 是 保持 图 像 中 有 效 的 细 线 状 物体 。 与 平 
均 滤波 器 相 比 ,中 值 滤波 咒 从 总 体 上 来 说 ,能 够 较 好 地 保留 原 图 像 中 的 跃 变 部 分 。 

5.4.3 ”多 图 像 平 均 法 


多 图 像 平 均 法 是 利用 对 同一 景物 的 多 幅 图 像 取 平均 值 来 消除 噪声 产生 的 高 频 成 分 ,因为 
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噪声 分 量 是 随机 的 ,其 值 是 随机 变化 的 ( 设 为 0 均值 ) ,有 正 有 负 ,平均 运算 以 后 很 有 可 能 被 抵 
消 ,在 图 像 采 集中 常 应 用 这 种 方法 消除 噪声 。 

多 图 像 平 均 法 以 噪声 干扰 的 统计 学 特征 为 基础 。 如 果 一 幅 图 像 包 含 品 声 , 可 以 假定 这 些 
噪声 相对 于 每 一 坐标 点 (*,y) 是 不 相关 的 , 且 其 数学 期 望 值 为 零 。 对 同一 景物 hl, y) 摄取 M 
WER g(x,y) (121,2, M) , 则 

gi(x,y) 2 f(x,y) +n; (x,y) (i21,2,--:,M) (5-35) 

n(x,y) 为 个 加 在 每 一 幅 图 像 g(x,y) 上 的 随机 相 加 噪声 ( 由 于 获得 图 像 时 可 能 有 随机 相 

加 性 噪声 存在 ) 。 可 以 得 出 ,第 n 


SNR = PEAN (5-36) 
(x XR [nji(w,y)., 


其 中 ,EL[ni (x,y) 人 
对 幅 图 像 作 灰 度 平均 , 则 平均 后 的 图 像 为 ; 


EG) =E belay) oar UG m G1 fo) + Xn) — (80) 
VAR pos RN: 


Brera »| | 


也 可 以 证 明 SNR = / MSNR, 


也 就 是 说 ,MM 幅 图 像 平 均 后 的 图 像 信 噪 比 是 单 幅 图 像 信 噪 比 的 VN 倍 ,通常 只 选 W =2 或 
3 ,以 免 有 处 理 时 间 太 长 。 

多 幅 图 像 取 平均 处 理 常用 于 照相 机 或 摄像 机 的 图 像 中 ,减少 相机 CCD 器 件 或 CMOS aff 
所 引起 的 噪声 。 这 时 对 同一 景物 连续 摄取 多 幅 图 像 并 数字 化 ,再 对 多 幅 图 像 进行 平均 ,这 种 方 
法 实际 应 用 中 的 难点 在 于 如 何 把 多 幅 图 像 配 准 起 来 ,以 便 使 采集 的 多 幅 图 像 中 同一 位 置 的 像 
素 能 保持 正确 的 对 应 关系 。 

5.4.4 频率 低 通 滤波 法 

从 信和 号 频谱 角度 来 看 ,信号 的 缓慢 变化 部 分 在 频率 域 属于 低频 部 分 , 而 信号 的 迅速 变化 部 
分 在 频率 域 属于 高 频 部 分 。 对 于 图 像 来 说 ,图 像 的 边缘 以 及 噪声 干扰 在 图 像 的 频 域 上 对 应 于 
图 像 傅立叶 变换 中 的 高 频 部 分 ,而 图 像 的 背景 区 则 对 应 于 低频 部 分 ,因此 可 以 用 频 域 低 通 滤波 
法 去 除 图 像 的 高 频 部 分 ,以 去 掉 噪 声 使 图 像 平滑 。 

根据 信和 号 系统 的 理论 , 低 通 滤波 法 的 一 般 形 式 可 以 写 为 ; 

G(u,v) 2 H(u,v)F(u,v) (5-39) 

式 中 ,F(w,v) 是 含 品 图 像 的 傅立叶 变换 ;G(w,v) 是 平滑 后 图 像 的 傅立叶 变换 ;有 (u,v) 是 
传递 函数 。 利 用 五 (u,v) 使 (u,v) 的 高 频 分 量 得 到 衰减 ,得 到 G(u,v) 后 再 经 过 傅立叶 反 变 换 
就 可 以 得 到 所 希望 的 图 像 g(x,y) 。 低 通 滤波 法 的 系统 框图 如 图 5-29 所 示 。 

选择 不 同 的 有 H(w,v) 可 以 产生 不 同 的 平滑 效果 ,常用 的 传递 函数 分 述 如 下 : 
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fo») F(x,y) wanes G(x, y) gx, y) 
u, v) 


[5-29 低 通 滤波 法 的 系统 框图 
1. 巴特 沃 思 低 通 滤波 器 ( BLPF) 
巴特 沃 思 低 通 滤波 器 又 称 为 最 大 平坦 滤波 器 , 它 的 通 带 与 阻 带 之 间 没 有 明显 的 不 连续 性 ， 
因此 它 的 空间 频 域 响应 没有 “ 振 铃 "现象 发 生 , 模 糊 度 减少 。 截 止 频 率 距离 原点 为 D,,n 级 巴 
特 沃 思 低 通 滤波 器 ( BLPT) 的 传递 函数 定义 为 . 


H(u,v) = i 


l4 (5 21) [P | 

其 中 ,Dp, 为 截止 频率 ;n 为 巴特 沃 思 低 通 滤波 器 的 级 数 ( 阶 数 ) 。 不 同 于 理想 的 低 通 滤波 器 ， 
它 的 传递 函数 与 被 滤 除 的 频率 之 间 没 有 明显 的 截断 。 显 然 , 当 D(z, 中 远 小 于 疡 时 ,H(w,o) 将 
接近 于 1; 当 D(wu,v) 远 大 于 D, 时 ,H(wu,v) 将 接近 于 0。 阶 数 n 越 高 ,巴特 活 思 低 通 滤波 器 越 
接近 于 理想 的 低 通 滤波 器 。 巴 特 沃 思 低 通 滤波 器 的 特性 曲线 如 图 5-30 所 示 。 

2. 指数 低 通 滤波 器 

指数 低 通 滤波 器 可 以 用 来 帮助 寻找 空间 域 和 频率 域 之 间 的 重要 联系 ,其 传递 函数 为 ， 

CT suci T (5-41) 

当 n=2,D(u,v) =D, 时 ,传递 函数 降 为 最 大 值 的 1/V2。 由 于 指数 低 通 滤波 器 具有 比较 
平滑 的 过 渡 带 ,因此 平滑 后 的 图 像 “ 振 铃 ” 现 象 不 明显 。 指 数 低 通 滤波 器 与 巴特 沃 思 低 通 滤波 
器 相 比 ,具有 更 快 的 衰减 特性 ,所 以 经 指数 低 通 滤波 器 处 理 的 图 像 比 巴特 沃 思 低 通 滤波 器 稍微 
模糊 一 些 。 图 5-31 是 指数 低 通 滤波 器 的 特性 曲线 。 


(5-40) 


H(u, v) H(u, v) 
1 1 
0 D (u, v) 0 D(u, v) 
5-30 巴特 沃 思 低 通 滤波 法 的 特性 曲线 图 5-31 指数 低 通 滤波 法 的 特性 曲线 


5.4.5 ”图 像 平滑 的 实现 

本 节 将 结合 上 述 的 理论 给 出 具体 的 实现 方法 ,包括 Matlab 的 仿真 实现 以 及 基于 C 语言 也 
DM642 代码 ,以 便 读者 深入 了 解 图 像 平滑 的 基本 概念 及 其 功能 ,掌握 其 实现 方法 。 

1. Matlab 仿真 实现 


为 使 代码 简洁 ,本 代码 的 测试 图 片 选择 灰 度 图 像 。 首 先 对 Lena 图 加 均值 为 0 ,方差 为 
=n 
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0.02 及 0.2 的 椒盐 噪声 ,然后 分 别 对 加 入 椒盐 噪声 的 Lena. 图 进行 均值 滤波 和 中 值 滤波 ,仿真 
结果 如 图 5-32 所 示 。 





的 图 像 d sas RR 


Ond die 


” 6) 均值 滤波 后 





g) 中 值 滤波 后 的 图 像 


图 5-32 Matlab 仿真 结果 


E 
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(1) 主 函数 M 文件 源 代码 
A =imread( 'G ; VPicture Mena. tif) ; 
B =imnoise( A ,'salt & pepper ,0.01);”% 加 均值 为 0, 方 差 为 0.01 的 椒盐 噪声 


C = MeanFilter( B,3) ; 和 对 有 椒盐 噪声 图 像 进行 3 x3 方形 窗口 均值 滤波 
D = MedianFilter( B ,3) ; 和 对 有 椒盐 噪声 图 像 进行 3 x3 方形 窗口 中 值 滤波 


figure(1) ; 
imshow( A) ; 
title(' 原始 图 像 ') ; 
figure(2) ; 
imshow( B) ; 
title C 加 入 椒盐 噪声 后 的 图 像 ') ; 
figure(3) ; 
imshow( C) ; 
title(' 均值 滤波 后 的 图 像 ) ; 
figure(4) ; 
imshow( D) ; 
title(' 中 值 滤波 后 的 图 像 ') ; 
(2) 均 值 滤波 函数 M 文件 源 代码 
function d =avg_filter(x,n)%x 是 需要 滤波 的 图 像 ,n 是 模板 大 小 ( 即 n x n) 
a(l:n,l:n) =1; 96a 即 n x n 模板 ,元 素 全 是 1 
[hight, width] 2size(x); % 输 入 图 像 是 hightxwidth 的 , 且 hight >n,width >n 
xl = double( x) ; 
x2 =xl; 
for i =1;hight -n +1 
for j Z1:width -n + 1 
c=xl(i:i+(n-1),j:j+(n-1)). *a; 
s =sum(sum(c)); 
x2(i+(n-1)/2,j+(n-1)/2) 2s/(n*n); 
end 
end % 未 被 赋值 的 元 素 取 原 值 
d =uint8( x2) ; 
(3) 中 值 滤波 函数 M 文件 源 代码 
function d = median, filter( x ,n) % 中 值 滤波 
[ height, width ] = size( x) ; 
x = double( x) ; 
for izl:height -n + 1 
for j =1:width -n +1 
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c=x(i:i+(n-1),j:j+(n-1)); PA nn 窗口 


e z reshape(c,1,n*n); 96 Ff n * n 窗口 转换 为 一 维 数组 
m = median( e) ; % 取 中 值 
d(i+(n-1)/2,j+(n-1)/2) =m; 
end 
end 
d =uint8 (d); 
(4) Matlab 仿真 结果 


2. 基于 DM642 系统 的 程序 

基于 TMS320DM642 DSP 处 理 平台 ,给 出 了 均值 滤波 和 中 值 算法 的 c 语言 实现 方法 。 
(1) 均 值 滤波 程序 设计 

程序 流程 图 

均值 滤波 流程 见 图 5-33。 






选择 窗口 尺寸 大 小 



































对 窗 内 所 有 像素 
灰 度 值 求 平均 值 





用 求 得 的 平均 值 
代替 窗口 中 心 像素 值 


= 


图 5-33 均值 滤波 流程 图 











Q@DM642 程序 源 代码 
#include < stdio. h > 
#include < stdlib.h > 
#define IMAGEWIDTH 256 
#define IMAGEHEIGHT 256 
#define Uint8 | unsigned char 
void ReadImage( char * cFileName) ; 
void bmpDataPart( FILE *  fpbmp) ; 
void MeanFilter( ) ; 
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unsigned char grey| IMAGEHEIGHT | | IMAGEWIDTH | ; 
void main( ) 
| 
/* 图 像 */ 
Readlmage("G:\\Picture\\lenal. bmp" ) ; 
MeanFilter( ) ; 
while (1); 


void ReadImage( char * cFileName) 
| 
FILE *fp; 
if ( fp=fopen(cFileName,"rb" ) ) 
| 
bmpDataPart( fp ) ; 
fclose( fp) ; 


| 
void bmpDataPart( FILE * fpbmp) 


| 
int i, j 20; 
unsigned char * pix = NULL; 
fseek( fpbmp, 54L, SEEK SET) ; 
pix = ( unsigned char * ) malloc (256) ; 
for(j =0;j «IMAGEHEIGHT;j + +) 
| 
fread( pix, 1, 256, fpbmp) ; 
for(i =0;i «IMAGEWIDTH ;i + +) 
| 
grey| IMAGEHEIGHT -1-j][i]  -pix[i]; 
| 


| 
void MeanFilter( ) 
| 
int i 20,j 20; 
int wheight = 1 ,wwidth 21; // 窗 口 大 小 (2 * wheight +1) * (2 * wwidth +1) 
int k 20,120; 
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double sum 20; 
for(i =0;i < IMAGEHEIGHT;i + +) 
| 
for(j =0;j <IMAGEWIDTH;j + +) 
| 
if((i> wheight - 1) && (i < IMAGEHEIGHT - wheight) && (j > wwidth -1) 
&& (j <IMAGEWIDTH - wwidth) ) 
| 
sum =0; 
for(k =i - wheight;k < =i + wheight;k + +) 
| 


for(12j - wwidth;l« =j +wwidth;l + +) 
| 


sum + = grey[ kj[1]; 


| 
grey[i][j] = sum/((2 * wheight +1) * (2 *wwidth+1)) +0.5; 
| 


| 

(CCS 仿真 设置 

选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗口 ,右键 单 击 图 像 窗 口 选择 Proper- 
ties 进行 图 像 显 示 配 置 ,设置 如 图 5-9 所 示 。 

加 入 噪声 及 均值 滤波 后 图 像 实 验 结果 见 图 5-34, 





a) 加 噪声 密度 为 0.02 的 椒盐 噪声 的 图 像 b) 均 值 滤波 后 图 像 


SS 


图 像 处 理 与 机 器 视 


Ek 





c) 加 噪声 密度 为 0.2 的 椒盐 噪声 的 图 像 d) 均 值 滤波 后 图 像 
Kd 5-34 加 入 噪声 及 均值 滤波 后 图 像 
(2) 中 值 滤波 程序 设计 
程序 流程 图 


中 值 滤波 流程 见 图 5-35 。 






选择 窗口 尺寸 大 小 





对 窗 内 所 有 像 
素 灰 度 值 排序 








用 排序 得 到 的 中 值 


代替 窗口 中 心 像素 值 


图 5-35 ”中 值 滤波 流程 图 











Q@DM642 程序 源 代码 
#include < stdio. h > 
#include < stdlib. h > 
#define IMAGEWIDTH 256 
#define IMAGEHEIGHT 256 
#define Uint8 unsigned char 
void ReadImage( char * cFileName ) ; 
void bmpDataPart( FILE * fpbmp) ; 
void MedianFilter( ) ; 
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unsigned char grey[ IMAGEHEIGHT | | IMAGEWIDTH | ; 
void main( ) 
| 
/* 图 像 */ 
ReadImage("C:\\Picture\\lenal. bmp" ) ; 
MedianFilter( ) ; 
while (1); 
| 
void ReadImage(char * cFileName ) 
| 
FILE * fp; 
if ( fp 2 fopen( cFileName," rb" ) ) 
| 
bmpDataPart(fp ) ; 
fclose( fp) ; 


| 
void bmpDataPart( FILE * fpbmp) 
| 
int 1, j =0; 
unsigned char * pix = NULL; 
fseek (fpbmp, 54L, SEEK SET) ; 
pix = (unsigned char * ) malloc (256) ; 
for(j 20;j «IMAGEHEIGHT;j + +) 
| 
fread( pix, 1, 256, fpbmp) ; 
for(i =0;i < IMAGEWIDTH ;i- +) 
| 
grey[ IMAGEHEIGHT -1 -j][i] =pix[i]; 
| 


| 
void MedianFilter( ) 
| 


1 
int i =0,j =0; 


int wheight = 1 ,wwidth 21; // 窗 口 大 小 (2 * wheight +1) * (2 * wwidth +1) 


int k z0,l =0; 
Uint8 temp[9] ,n =0,mid =0; 
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for(i =0;i «IMAGEHEIGHT;i + +) 
| 
for(j =0;j «IMAGEWIDTH ;j + +) 
| 
if( (i > wheight - 1) && (i < IMAGEHEIGHT ~ wheight) && (j > wwidth - 1) 
&& (j «IMAGEWIDTH - wwidth) ) 
| 
n 20; 
for(k =i - wheight;k < =i + wheight;k + + ) 
| 


for(12j - wwidth;l < 2j wwidth;l-4 + ) 


j 
1 


temp[n] = grey[ k] [1]; 
[s 


for(k Z0;k «8;k - +) 
| 
for(1=0;l <8.k;l+ +) 
| 
if(temp[ 1] » temp[ 1-1]) 
| 
mid = temp[l]; 
temp[1j = temp| 141); 
temp[ 1-1] = mid; 


GCCS 仿真 设置 

选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗 口 ,右键 单 击 图 像 窗 口 选择 Proper- 
ties 进行 图 像 显 示 配 置 , 设 置 如 图 5-9 所 示 。 

二 实验 结果 

加 入 噪声 及 中 值 滤波 后 图 像 实验 结果 见 图 5-36。 
eg e 





c) 加 噪声 密度 为 0.2 的 椒盐 噪声 的 图 像 d) 中 值 滤波 后 图 像 


Kd 5-36 ”加 入 品 声 及 中 值 滤 波 后 图 像 


5.5 图 像 锐 化 


图 像 模糊 是 常见 的 图 像 降 质问 题 ,图 像 在 传输 和 变换 过 程 中 会 受到 各 种 干扰 因素 而 退化 ， 
如 光 的 衍射 .聚焦 不 良 `. 景 物 和 取 像 装置 的 相对 运动 都 会 使 图 像 模糊 ,电子 系统 高 频 性 能 不 好 
也 会 损失 图 像 的 高 频 分 量 , 使 图 像 不 清晰 。 在 图 像 识别 中 ,为 了 将 物体 从 图 像 中 分 离 出 来 或 将 
表示 同一 物体 表面 的 区 域 检测 出 来 ,往往 要 求 图 像 具 有 鲜明 的 轮廓 边缘 、 清 晰 的 细节 以 及 灰 度 
跳 变 部 分 ,这 就 需要 对 图 像 进行 锐 化 处 理 。 但 需要 注意 的 是 , 锐 化 可 能 使 噪声 受到 比 有 用 信和 号 
更 强 的 增强 ,因此 ,常用 的 方法 是 先 去 除 或 减 小 噪声 后 ,再 进行 锐 化 处 理 。 

图 像 锐 化 又 称 为 图 像 细 节 边 缘 增强 , 即 是 对 图 像 进行 清晰 度 的 强调 ,以 锐 化 增强 图 像 中 的 
细节 边缘 和 轮廓 线 为 目的 。 图 像 的 清晰 度 是 指 图 像 轮廓 边缘 的 清晰 程度 ,包括 : 

(1) 分 辨 出 图 像 线条 间 的 区 别 ; 即 图 像 层 次 对 景物 质点 的 分 辨 率 或 细微 层次 质感 的 精细 
程度 。 

(2) 衡 量 线条 边缘 轮廓 是 否 清晰 : 即 图 像 平面 清晰 度 和 图 像 边缘 锐利 程度 ,常用 锐 度 表 
示 , 其 实质 是 指 层 次 边界 渐变 密度 的 过 渡 宽度 。 

(3) 衡 量 图 像 的 细小 层次 间 的 清晰 程度 :尤其 是 细小 层次 间 的 明暗 对 比 或 细微 反差 是 否 
清晰 。 
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5.5.1 微分 法 

大 量 的 研究 表明 ,各 种 图 像 变 模糊 的 物理 过 程 的 数学 模型 一 般 含 有 求 和 、 平 均 或 积分 
运算 ,因此 ,图 像 的 锐 化 可 以 用 它 的 反 运算 (微分 运算 ) 来 实现 。 微 分 运算 的 实质 是 求 信号 
的 变化 率 ,而 图 像 的 边缘 像素 都 是 灰 度 变化 剧烈 的 地 方 , 所 以 对 图 像 的 微分 运算 可 以 实现 
Bib. 

由 于 图 像 的 内 容 各 种 各 样 ,边缘 的 走向 也 各 不 相同 ,为 了 把 图 像 中 的 任何 方向 伸展 的 模糊 
边缘 和 轮廓 变 清 晰 ,对 图 像 的 某 种 导数 运算 应 是 各 向 同性 的 , 故 应 当 采 用 各 向 同性 的 ,旋转 不 
变 的 线性 微分 算 子 才能 适用 于 不 同 的 边缘 ,梯度 法 和 拉 普 拉 斯 运算 法 都 符合 上 述 条 件 。 

1. 梯度 法 

梯度 是 图 像 处 理 中 最 常用 的 一 次 微分 方法 。 对 于 图 像 函数 的 x,y) , 它 在 点 f(x,y) 处 的 梯 
度 定义 为 矢量 : 


Ví sU Xl -[Z | (5-42) 
梯度 的 方向 在 函数 f(x,y) 最 大 变化 率 的 方向 上 ,梯度 的 幅度 可 由 下 式 计算 . 
IVA(x,7)1= (£) (2) | (5-43) 


离散 图 像 可 用 差分 近似 表示 式 (5-39) ,一 阶 偏 导数 采用 一 阶 差 分 近似 表示 为 : 
IV f(x,y) l= LU Gs) -f +l,y)]  UGsy) -Fay 8) 117 (5-44) 
为 了 便于 编程 和 提高 运算 速度 ,在 计算 精度 允许 的 情况 下 3X (5-44) 可 采用 绝对 差 算法 
简化 为 : 
IV f(x,y)| 2 U(x,y) -fx *Y,y)l € U(x,y) -fCx,y € 1)1 (5-45) 
这 种 梯度 方法 又 称 为 水 平 垂直 差分 法 , 式 中 各 像素 的 位 置 如 图 5-37a) 所 示 。 男 一 种 梯 
度 法 被 称 为 罗伯特 梯度 法 ,将 式 (5-44) 表 示 为 如 式 (5-46 ) 的 形式 ,图 形 表 示 如 图 5-37b ) 
所 示 。 


fo, y) fGH,») fGH, y+) 





a) 水 平 垂直 差分 法 b) 罗伯特 梯度 法 
图 5-37 求 梯度 的 两 种 差分 方法 
IVf(z,y)1={[f(x,7) -fx+l,y +1)] + [f(x+1,y) -f(x,y+1)] "| (5-46) 
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同样 可 以 采用 绝对 差 算 法 近似 表示 
IVf(x,y)l =If(x,y)-f(x+1,y +1)! + lf(x *1,y) -f(x,y *1)1 (5-47) 
该 算法 的 边缘 提取 效果 要 比 式 (5-45 ) 明显 ,产生 的 边缘 稍 强 。 
HX (5-47 ) 可知, 在 遍历 处 理 图 像 的 过 程 中 ,最 后 一 行 或 最 后 一 列 的 像素 点 无 法 计算 梯 
度 值 ,这 时 一 般 就 用 前 一 行 或 前 一 列 的 梯度 值 近似 代替。 
由 于 边缘 灰 度 变化 剧烈 ,图 像 经 过 梯度 运算 后 边缘 会 凸显 出 来 ,因此 我 们 可 以 直接 用 梯度 
的 幅度 作为 像素 灰 度 值 输出 ,如 式 (5-48 ) : 
g(x,y) 21V f(x,y) (5-48) 
但 如 果 仅 仅 使 用 梯度 值 作为 像素 灰 度 , 则 只 能 显现 出 边缘 轮廓 ,由 于 灰 度 变化 平缓 的 背景 
区 域 经 梯度 运算 后 梯度 值 近似 为 零 , 则 表现 在 图 像 上 背景 区 域 全 部 较 暗 ,因此 不 能 满足 人 们 的 
要 求 , 所 以 常常 选择 式 (5-49 ) 作为 输出 。 
IVf(x,y)] IVf(x,y)l 2T 


A j=] (5-49) 
LEAN 其 他 


另 一 种 方法 是 规定 特定 的 灰 度 级 ,将 边缘 或 非 边缘 设 定 为 固定 灰 度 级 L, ,表示 为 : 


L IV f(x,y) 2T 
g(x,y) a (5-50) 
fy) 其 他 


(5-51) 


IVf(x,y)) IVf(x,y)l 2T 
g(x,y) -| 


其 他 


在 某 些 情况 下 ,我们 只 想 区 别 边缘 像素 与 非 边 缘 像素 ,这 时 可 采用 二 值 化 图 像 输出 方式 ， 

即将 边缘 和 非 边 缘 均 设 定 为 特定 的 灰 度 级 ,其 表达 式 为 ; 
Lo IVf(x,y)l2T 
(x,y) = | (5-52) 
LUE CREEK. 

该 方法 将 边缘 灰 度 级 固定 为 工 ,背景 区 域 灰 度 级 固定 为 ,由 此 图 像 变 为 二 值 化 图 像 输 
出 ,边缘 轮 廊 分 明 便 于 研究 图 像 的 轮廓 信息 。 

2. 拉 普 拉 斯 算 子 法 

在 图 像 增强 处 理 中 ,一 阶 微分 法 无 法 达到 需要 的 效果 ,可 以 采用 二 阶 微分 法 。 拉 普 拉 斯 算 
子 是 锐 化 中 最 常用 的 一 种 二 阶 微分 法 比较 适用 于 改善 因为 光线 漫 反 射 造 成 的 图 像 模 糊 。 
Laplacian 算 子 是 线性 二 阶 微分 算 子 。 即 


of F 
yatai (5-53) 


XT BRA fU.) , 拉 普 拉 斯 算 子 定义 为 : 
一 161 一 


图 像 处 理 与 机 器 视觉 


VSG, k) =AFG,k) + ADF) (5-54) 


这 里 A2f(j,k) 和 A2f(j,k) 是 f(j,k) 在 x 方向 和 y 方 向 的 二 阶 差分 ,所 以 离散 函数 的 拉 普 
拉 斯 算 子 的 表达 式 为 : 


VFG, k) 2f(j +1,k) +fG-1,k) +fG,k+1) -fü,k-1) -AfG,k) (5-55) 
拉 普 拉 斯 算 子 是 标量 ,一 般 取 正 值 或 绝对 值 。 拉 氏 算 子 锐 化 时 ,其 锐 化 输出 为 : 
G(j,k) 2 F(,k) -VFO ,k) (5-56) 


二 维 离散 图 像 (j,k) 经 拉 普 拉 斯 算 子 锐 化 后 具有 一 维 图 像 F()) 对 拉 普 拉 斯 算 子 锐 化 所 
拥有 的 特性 。 因 为 由 式 (5-55) 和 式 (5-56) 可 得 : 


G(j,k) -5F(j,k) - [ F(j lk) * F(j -2,k) +F(j,k+1)+F(j,k-1)] (5-57) 


当 F(j,k) 在 斜坡 中 间或 均匀 区 间 时 ,CG(j,k) = FG, k) 。 当 点 (7 让) 恰好 在 斜坡 底 , 或 者 在 
灰 度 界限 的 低 灰 度 级 一 侧 时 ,邻近 的 灰 度 高 于 或 等 于 F(j,k) , 即 在 图 像 比较 暗 的 区 域 中 出 现 
了 比较 亮 的 点 ,其 (=V2F) 小 于 F(j,h) 点 的 灰 度 ,从 而 产生 “下 冲 ”"。 同 样 ,在 斜坡 项 部 或 灰 
度 界 限 的 高 灰 度 级 一 侧 , 没 有 灰 度 级 高 于 F(j,k) ,于 是 (-V2F) 大 于 (j,k) 的 邻 点 就 会 产生 
“上 冲 "。 拉 普 拉 斯 算 子 方法 比较 适合 锐 化 增强 图 像 中 线段 点 、 孤 立 线 或 孤立 点 的 视觉 效果 ， 
是 一 种 比较 好 的 图 像 锐 化 方法 ,对 图 像 界限 有 明显 的 增强 作用 。 常 用 的 拉 普 拉 斯 模板 如 
图 5-38 所 示 

"rite 下 面 介 绍 一 种 改进 型 拉 普 拉 斯 锐 化 的 方法 一 一 受 限 拉 氏 锐 化 。 

Li apa] 拉 普 拉 斯 锐 化 算法 虽然 可 以 提取 出 图 像 中 的 边缘 信息 ,但 是 极 易 引 

| 。 | 1 | 。 | 和 信 许 多 噪声 。 因 此 在 锐 化 的 同时 必须 保护 图 像 的 有 效 性 ,相对 于 普 
图 5.38 拉 普 拉 斯 运算 模板 通 的 拉 普 拉 斯 锐 化 , 受 限 拉 氏 锐 化 后 图 像 边 缘 被 加 强 的 程度 更 大 ,并 
且 有 效 地 控制 了 图 像 的 噪声 加 强 , 使 处 理 后 的 图 像 边 缘 更 加 清晰 ,保护 了 图 像 的 细节 ,将 边缘 
增强 和 噪声 抑制 较 好 的 结合 在 一 起 。 

受 限 拉 普 拉 斯 锐 化 算法 的 主要 思想 是 通过 引入 对 比 度 观察 邻 域 与 中 心 像素 的 差异 , 即 仅 
对 对 比 度 较 小 的 区 域 做 锐 化 处 理 。 该 方法 可 以 表达 为 : 设 P,,P,,…,P, X P, 的 8 邻 域 ,6 代 
XT P, 的 8 邻 域 对 比 度 ,P' 为 变换 后 的 像素 值 。 





Py = Max( P,,P, P.) (5-58) 
P, = Min( P ,P, ,---, P4) (5-59) 
Py -Pa 
iy +P, Dy 
P; 0.5105 
P; = (5-61) 
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5.5.2 高通 滤波 法 

从 男 一 方面 看 ,图 像 边 缘 及 急剧 变化 部 分 与 图 像 高 频 分 量 有 关 , 因 此 利用 高 通 滤波 器 衰减 
图 像 信号 的 低频 部 分 能 相对 增强 图 像 的 高 频 部 分 ,实现 图 像 锐 化 的 目的 ,高 通 滤波 可 用 空域 和 
频 域 两 种 方法 来 实现 。 

1. 空域 高 通 滤 波 

高 通 滤波 在 空间 域 是 用 卷 积 方法 实现 的 ,建立 在 离散 卷 积 基础 上 的 空间 域 高 通 滤波 关系 
RY: 





g(x,y) - E Xf(m,n)H(x-m«*1,y-n«1) (5-62) 
式 中 ， g(x%,y) 一 一 锐 化 输出 ; 
f(m,n) 输入 图 像 ; 
H(x-m+1,y -n+1) 一 一 系统 单位 冲 激 响 应 阵列 。 
下 面 为 几 种 常用 的 高 通 卷 积 模板 
0 -1 0] [4 -1 A 
| E «We sp tel 
0 -1 0 | L-1 -1 -1j 
1 -2 1] 5 NO c n 
Hicc5 o cx gener 4 3 
1 -2 1 -1 -2 -1l 











2. 频 域 高 通 滤波 
(1) 理 想 二 维 高 通 滤波 器 
0 D(u,v)xD, 
FOI Dino ad, x 
其 中 ,D。 是 已 知 的 非 负数 , 称 作 截 止 频率 或 者 截止 半径 ;D(uz,z) 指点 (wz) 到 频率 矩形 原 
点 的 距离 。D(w,v) 可 以 表示 为 : 
H(u, v) 


D(u,v) = Vu v (5-64) 


Hi3X (5-64) 可知, 该 高 通 滤波 器 将 D, 为 半径 的 圆 内 1.0 
的 频率 成 分 衰减 掉 , 而 高 频 部 分 通过 , 因此 经 高 通 滤波 后 
的 图 像 背 景 往 往 呈 现 灰 黑色 。 传 递 函 数 H (u,v) 的 特性 


1 
l 
| 
1 
| 
0.5 | 
1 
| 
1 
| 


曲线 如 图 5-39 所 示 。 
(2) 巴 特 沃 斯 滤波 器 (图 5-40) 
1 0 D, D, D (u, v) 
H SENS Pri PUTARET ÉL 
Pod [£42 5153 DD n) ]^ cr 图 5-39 ”理想 高 通 滤波 器 
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或 
ey oy 一 
H(u,9) T D/D(u s) ]^ od 
其 中 DCu v) T 
D(u,v) = Jw «v (5-67) 


其 中 ,D, PARER; Duw) 为 点 (wz) 到 频率 矩形 原点 的 距离 。 使 用 巴特 沃 斯 滤波 
髓 处 理 图 像 , 随 着 截止 半径 D, 的 增 大 ,图 像 的 质量 将 越 来 越 好 ,但 是 随 着 n 的 增加 ,一 般 会 出 
现 “ 振 铃 " 现 象 ,最 后 滤波 结果 跟 理 想 高 通 滤波 非常 接近 。 

(3) 指 数 滤波 右 ( 图 5-41) 





0 1 2 3 Dov) 0 1 2 3 D(u,v) 
图 5-40 巴特 沃 斯 高 通 滤波 器 图 5-41 指数 高 通 滤 波 器 
Heup) sa n (5-68) 
或 
H(u,v) 2g my Duo) ]^ (5-69) 


( 4) PJÉ EC aS ( d 5-42) 
0 D(u,v) «D, 


l 
H(u,v) = 5 -p Uo D, €D(u,v) <D, 





H(u, v) 
1 D(u,v) » D, 
1.0 
(5-70) 
- 5.5.3 图像 锐 化 的 实现 
本 节 将 结合 上 述 的 理论 给 出 具体 的 实现 方法 ,包括 
Matlab 的 仿真 实现 以 及 基于 C 语言 的 适用 于 DM642 系统 
D DO,» 的 具体 代码 ,以 便 读者 深入 了 解 锐 化 的 基本 概念 及 其 特点 ， 
图 5-42 ”梯形 高 通 滤 波 器 掌握 其 实现 方法 
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1. 锐 化 的 Matlab 仿真 实现 

(1) 梯 度 法 

I = imread( 'D ; \Administrator \My Pictures \Lenagray. bmp!) ; 
imshow( I) 

J = double( I) ; 

[ Gx, Gy ] = gradient( J) ; 
G =sqrt( Gx. * Gx + Gy. 
J=; 

K =find( G >20); 

J(K) =255; 

figure ,imshow( J) ; 


(2) 拉 普 拉 斯 算 子 


* Gy); 


A = imread( 'D ; \ Administrator \My Pictures VLenagray. bmp!) ; 


figure(1) ; imshow( A); 

title(' 原 图 '); 

I = double( A) ; 

h-[010;1 -41;,010]; 

J 2conv2( I, h, 'same') ; 

K - uint8( J) ; 

imshow( K); 

(3 ) 梯 度 法 和 拉 普 拉 斯 算 子 法 的 锐 化 效果 对 比 


梯度 法 和 拉 普 拉 斯 算 子 法 的 锐 化 效果 对 比如 图 5-43 所 示 。 





b) 梯度 法 增强 效果 


梯度 法 和 拉 普 拉 斯 算法 增强 效果 的 对 比 


a) 原 图 


图 5-43 


2. DM642 DSP 系统 的 算法 实现 

本 节 基 于 TMS320DM642DSP 图 像 处 理 平台 ,给 出 了 
程序 流程 图 

流程 见 图 5-44。 
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% 读 入 图 像 

% 显示 原 图 像 

% 转换 为 double 类 型 
% 计算 梯度 

% 水 平 垂直 差分 


96 TAE XE IR HI. 

9c 指定 灰 度 级 

% 显 示 处 理 后 的 图 像 
% 读 入 灰 度 图 像 

oo m M LJ 原 图 像 

% 拉 普 拉 斯 算 子 

% 与 算 子 卷 积 


% 显 示 锐 化 后 图 像 





c) 拉 普 拉 斯 运算 法 增强 效果 


锐 化 算法 的 C 语言 实现 。 
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初始 化 工作 变量 
打开 图 像 文件 


定位 在 54L 载 入 
图 像 信息 








相关 变量 定义 


读 取 待 处 理 图 像 
拉 普 拉 斯 算 子 法 








处 理 后 图 像 显 示 





a) 主 流程 图 b) 读 取 图 像 流程 图 
图 5-44 程序 流程 图 
(22DM642 程序 源 代码 
在 程序 中 ,主要 子孙 数 有 ReadImage , GradsSharp , LaplacianSharp 分 别 用 来 读 取 图 像 、 梯 度 
法 锐 化 和 拉 普 拉 斯 算 子 法 锐 化 。 


#include < stdio. h > 

#include < stdlib. h > 

#define IMAGEWIDTH 256 

#define IMAGEHEIGHT 256 

#define Uchar unsigned char 

void ReadImage(char * cFileName) ; 

void BmpDataPart( FILE * fpbmp ) ; 

void GradsSharp( ) ; 

void LaplacianSharp( ) ; 

#pragma DATA, SECTION ( grayout , " . my, sect" ) 

Uchar gray[ IMAGEHEIGHT ]  IMAGEWIDTH | ; 

Uchar grayout[ IMAGEHEIGHT | | IMAGEWIDTH | ; 

void main( ) 

| 
/* 读 取 图 像 */ 
ReadImage("D:\\Administrator\\My Pictures \ \Lenagray. bmp" ) ; 
/ 梯度 图 像 锐 化 处 理 * / 
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GradsSharp( ) ; 
/* 拉 普 拉 斯 图 像 锐 化 处 理 */ 
// LaplacianSharp( ) ; 
while (1); 
| 
void ReadImage(char * cFileName) 
| 
FILE * fp; 
if ( fp = fopen( cFileName," rb" ) ) 
| 
BmpbDataPart( fp) ; 
fclose( fp) ; 
| 
| 
void BmpDataPart( FILE * fpbmp) 
| 
int 1, j 20; 
unsigned char * pix 2 NULL; 
fseek( fpbmp, 1078L, SEEK SET) ; 
pix = (unsigned char * ) malloc(256) ; 
for(j =0;j «IMAGEHEIGHT;j + +) 


fread ( pix, 1, 256, fpbmp) ; 
for(i =0;i < IMAGEWIDTH;i + +) 
| 
gray[ IMAGEHEIGHT -1 -j] [i] =pix[i]; 
grayout[ IMAGEHEIGHT - 1 -j][i] 2 pix[i]; 


| 
/ * 梯度 锐 化 处 理 * / 
void GradsSharp( ) 
| 
int i,j; 
int temp; 
Uchar bThreshold = 25; // 阅 值 
for(i =1;i < IMAGEHEIGHT -1;i * +) 
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for(j 21;j «IMAGEWIDTH -1;j+ +) 
| á 
temp = abs(gray[i][j] - gray[i+1][j]) + 
abs(gray[i][j] -gray[i][j+1]); // 采 用 绝对 差分 算法 
if( temp > bThreshold ) 
| 
grayout[i][j] = 255; 


/ * 利用 Laplacian 算 子 进行 锐 化 处 理 比较 * / 
void LaplacianSharp( ) 
| 
int 1,j, number , row , col ; 
int temp; 
int Laplacian array[9] = 10,-1,0, 
cs s. 
0, -1,01; 
for(i =1;i «IMAGEHEIGHT -1;i 4 +) 
| 
for(j =1;j<IMAGEWIDTH -1;j * +) 
| 


number - 0; 


temp 20; 
for(col = -1;col < 21;col + +) 
| 
for(row = -1;row < 21;row * +) 


| 
temp + =  Laplacian array | number | * gray[ i * row] | j * col ] ; // 卷 积 运 算 
number + +; 


| 


| 
Í 


if( temp <0) 
temp = 0; 
if( temp >255) 
temp = 255; 
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grayout[i][j] = temp; 


| 

ccs 仿真 设置 

选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗 口 ,右键 单 击 图 像 窗 口 选择 Proper- 
ties 进行 图 像 显 示 配 置 ,设置 如 图 5-9 所 示 。 

@ 实 验 结 

以 上 代码 分 别 以 梯度 方法 锐 化 处 理 函 gradsSharp ( ) 和 拉 普 拉 斯 图 像 锐 化 处 理 Laplacian- 
Sharp ( ) 对 图 像 进行 处 理 , 得 到 实验 结果 如 图 5-45 所 示 。 





Ó Fie td s 
bo ui ve Mmm rr reoco FIST 
[m Em TZS B m x n| es 
Faja 'anmOHm4 | j 

Jj 










void Readlmage(cher | 


| FILE sfp; 
if ( fp-fopen(cFi 


art (fp) 





: BmpDataj 
telose (1p) 
TE 











四 -下 TEEL 





Ty jui pati 


1 
2 HALTED g Fle CACCStudio v3-3YMyProjects vuihua. i 



































a) 处 理 前 图 像 “总 梯度 法 增强 后 的 图 像 后 


IE i 
CEA- PES T ~ Aaa T av tr 
i CLT ESE- SE 55 

gie ams. 














FRSE 


o) 拉 普 拉 斯 运算 法 增强 后 的 图 像 











图 5-45 梯度 法 和 拉 普 拉 斯 算法 的 对 比 


5.6 同 态 增 晰 


在 数字 信和 号 处 理 的 早期 研究 中 ,线性 滤波 器 是 主要 处 理 手段 。 它 对 加 性 高 斯 噪声 有 较 好 

的 平滑 作用 。 然 而 当 信号 中 含有 非 肘 加 性 噪声 时 ,线性 滤波 器 的 处 理 结果 就 很 难 令 人 满意 。 于 

1958 年 Wiener 就 提出 了 非 线性 滤波 理论 , 非 线性 滤波 器 以 稳健 统计 学 数学 形态 学 等 为 

论 基础 ,能够 很 好 地 保护 细节 ,同时 去 除 信号 中 的 噪声 。 同 态 滤波 作为 非 线性 滤波 的 一 个 重要 
mis 在 语音 、 图 像 雷 达 、 声 呐 、 地 震 勘 探 以 及 生物 医学 工程 等 领域 中 ,获得 了 广泛 地 应 用 。 
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同 态 滤波 是 一 种 在 频 域 中 同时 进行 图 像 对 比 度 增强 和 压缩 图 像 亮 度 范围 的 特殊 滤波 方 

法 ,和 常用 于 处 理 图 像 光照 不 均 引 起 的 图 像 降 质 , 是 一 种 基于 图 形成 像 模 型 的 图 像 增强 方法 。 图 

像 处 理 中 的 同 态 滤波 是 基于 以 反射 光 和 入 射 光 为 基础 的 图 像 模型 的 ,车 一 幅 图 像 亮 度 f(x,y) 
由 它 的 照明 分 量 i(x,y) 及 反射 分 量 r(x,y) 组 成 ,那么 图 像 的 模型 可 以 表示 为 : 

f(x,y) si(x,y)r(x,y) (5-71) 


为 增强 对 比 度 ,应 加 大 反射 率 分 量 ; 为 压缩 动态 范围 ,应 减 小 照度 分 量 , 因 此 可 用 下 列 方 法 
把 两 个 分 量 分 开 分 别 进行 滤波 ,如 图 5-46 所 示 。 


fo, y) go») 
EX [om | 


图 5-46， 同 态 增 晰 流程 图 
(1) 先 对 式 (5-71) 的 两 边 同 时 取 对 数 ,使 图 像 模型 中 的 乘法 运算 组 合 变 成 简单 的 对 数 加 
法 运算 组 合 , 即 


Inf(x,y) =Ini(x,y) *Inr(x,y) (5-72) 
(2) 将 上 式 两 边 取 传 立 叶 变 换 , 得 
F(u,v) 2I(u,v) * R(u,v) (5-73) 
(3) 选 择 一 个 合适 的 频 域 函数 Hu v) EI Pe RRE F(u sv) ,可 得 到 
H(u,v)F(u,v) 2 H(u,v)I(u,v) * H(u,v) R(u,v) (5-74) 
(4) 对 滤波 结果 进行 傅立叶 反 变 换 到 空域 ,得 
hi(x,y) 2 hi(x,y) *h(x,y) (5-75) 
(5) 再 将 上 式 两 边 取 指数 ,得 
g(x,y) =explhi(x,y)| =explh,(x,y) lexplh,(x,y) | (5-76) 


得 到 同 态 滤波 后 的 输出 结果 ,可 见 增强 后 的 图 像 是 由 分 别 对 应 照度 分 量 与 反射 分 量 的 两 

部 分 和 加 而 成 。 
H(u ,v) 称 为 同 态 滤波 函数 ,可 以 分 别 作用 于 照度 分 量 和 反射 分 量 上 。 从 同 态 滤波 的 实现 
过 程 可 以 看 出 ,能 否 达 到 预期 的 增强 效果 并 取得 压缩 灰 度 


H(u, v) 的 动态 范围 的 效果 取决 于 同 态 滤波 传递 函数 H (u,v) 的 选 
" 择 。 因 一 般 照度 分 量 是 在 空间 缓慢 变化 的 ,而 反射 分 量 在 
不 同 物体 的 交界 处 是 急剧 变化 的 ,所 以 图 像 对 数 傅立叶 变 
1 换 中 的 低频 部 分 主要 对 应 照度 分 量 ,而 高 频 部 分 主要 对 应 
反射 分 量 。 以 上 特性 表明 可 以 设计 一 个 对 傅立叶 变换 的 高 

H. 频 和 低频 分 量 影响 不 同 的 滤波 函数 H (u,v) 。 
0 如 图 5-47 所 示 ,滤波 函数 Hu v) 可 以 对 低频 段 进 行 


P SEEN 动态 范围 压缩 ,而 对 图 像 的 高 频段 进行 动态 范围 拉 伸 , 结 
55-47 RRE 果 是 同时 压缩 了 图 像 的 动态 范围 和 增加 了 图 像 局 部 区 域 
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之 间 的 对 比 度 。 

5.6.1. 同 态 增 晰 算法 的 实现 

1. Matlab 仿真 实现 

(1) 同 态 滤波 的 M 文件 源 代码 。 

针对 图 像 moon. bmp ,设计 一 个 同 态 滤 波 器 ,选择 指数 高 
通 滤波 器 对 经 过 快速 传 立 叶 处 理 后 的 频 域 图 像 进行 滤波 , 指 





数 高 通 滤波 器 如 图 5-48 所 示 。 0 | 3 * 55355 
具体 Matlab 程序 代码 如 下 ; 图 5-48 ”指数 高 通 滤波 器 
clear all 


I = imread( 'D ; \\ Administrator \ VW My Pictures V \moon. bmp!) ; 
[M N] =size(I) ; 
figure( 1) ,imshow( T) ; 
T = double( I) ; 
L zlog(T 41); 
F -ffi2(L); 
P = fftshit( F) ; 
figure( 2) ,imshow( uint8 ( real( P) ) ) ; 
for 1=1:M 

for j =1:N 

D(i,j) ((1-M/2)2*(j -N/2)22); 

end 
end 
c 20.15; 
DO = max( M,N); 
Hz(1.1-0.1) * (I -exp(c* ( -D/(D02))))+0.1; 
F=F. *H; 
F =ifft2 (F); 
Y =exp(F); 
G=real( Y); 
Q=60 * G; 
figure(3) , imshow( uint8( Q) ) ; 
(2) Matlab 处 理 结果 如 图 5-49 所 示 。 
2. DSP 系统 的 算法 实现 
这 里 基于 TMS320DM642 DSP 处 理 平 台 设计 图 像 滤 波 算法 。 
QD 程序 流程 图 - 
DSP 图 像 滤 波 算法 如 图 5-50 所 示 。 
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a) 原始 图 像 b) 频 域 图 像 c) 滤波 后 图 像 


图 5-49 Matlab 同 态 滤波 


( ”开始 ) 开始 
















































































Y 
| 读 取 图 像 数 据 
相关 变量 定义 | 
对 数 运算 处 理 
Y Y 
读 取 待 处 理 图 像 FFT 运 算 变换 到 频 域 
| Y 
指数 高 通 滤波 器 
同 态 滤波 函数 滤波 处 理 
Y 
1 IFFT 变 换 到 空域 
处 理 后 图 像 显示 
Y 
指数 运算 处 理 
a) 程序 主流 程 图 b) 同 态 滤波 流程 图 


图 5-50 ”程序 流程 图 

CDM642 程序 源 代码 

#include < stdio. h > 

#include < stdlib. h > 

#include < math. h > 

#define pi 3.1415926 

#define Width 128 

#define Height 128 

void ReadImage( char * cFileName) ; 

void bmpDataPart( FILE * fpbmp) ; 
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void fft( ) ; 
void ifft( ) ; 
void EHPF( ) ; 
*pragma DATA, SECTION( input," . my. sect" ) 
#pragma DATA. SECTION( fdout , " . my. sect" ) 
#pragma DATA, SECTION( tdout , " . my, sect" ) 
#pragma DATA, SECTION( fd. re," . my. sect" ) 
*pragma DATA, SECTION( fd, im," . my. sect" ) 
*pragma DATA, SECTION( td, re," . my, sect" ) 
#pragma DATA, SECTION( td, im," . my. sect" ) 
#pragma DATA, SECTION( wxl. re," . my, sect" ) 
#pragma DATA. SECTION ( wxl, im," . my. sect" ) 
#pragma DATA, SECTION( wx2 re,". my. sect" ) 
#pragma DATA. SECTION( wx2. im," . my, sect" ) 
8pragma DATA, SECTION( wco re," . my. sect" ) 
#pragma DATA, SECTION ( wco, im," . my. sect" ) 
#pragma DATA. SECTION ( hx1, re," . my, sect" ) 
#pragma DATA. SECTION ( hx1, im," . my, sect" ) 
#pragma DATA, SECTION( hx2, re," . my, sect" ) 
fpragna DATA, SECTION( hx2, im," . my, sect" ) 
#pragma DATA, SECTION ( hco, re," . my, sect" ) 
#pragma DATA, SECTION ( hco. im," . my, sect" ) 
unsigned char input| Height | | Width | ; 

unsigned char fdout| Height | [ Width ] ; 

unsigned char tdout| Height | [ Width ] ; 

double fd, re[ Height] | Width | ; 

double fd, im[ Height | | Width | ; 

double td, re[ Height] [ Width | ; 

double td. im[ Height ] | Width | ; 

double wx1, re[ Width | ; 

double wxl_im[ Width ] ; 
double wx2, re[ Width | ; 
double wx2, im| Width | ; 
double wco, re| Width | ; 
double wco, im| Width ] ; 
double hx1, re[ Height] ; 
double hx1, im[ Height] ; 
double hx2, re[ Height | ; 
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double hx2. im| Height | ; 
double hco. re| Height | ; 
double hco, im[ Height | ; 
void main( ) 
| 
/* 图 像 */ 
ReadImage(" moonnew. bmp" ) ; 
// 傅 氏 变换 
fft( ) ; 
// 频 域 滤波 (指数 高 通 滤波 器 ) 
EHPF( ) ; 
// 18 K bL AE RS 
ifft( ) ; 
while (1); 
| 
void ReadImage( char * cFileName) 
| 
FILE * fp; 
if ( fp zfopen(cFileName,"r b" ) ) 
| 
bmpDataPart( fp) ; 
fclose(fp) ; 


j 
void bmpDataPart( FILE * fpbmp) 
| 
int i, j 20; 
unsigned char * pix 2 NULL; 
fseek (fpbmp, 1078L, SEEK, SET) ; 
pix = ( unsigned char * ) malloc ( Width ) ; 
for(j 20;j < Height;j + +) 
| 
fread( pix, 1, Width , fpbmp) ; 
for(i =0;i < Width;i- +) 
| 
input[ Height -1 -j][i] =pix[i]; 
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| 


void EHPF( ) 


| 


l 
| 


int x z0,y z0,nl,n2; 
double c 20. 15; 
double D 20,H 20; 
nl = Height/2; 
n2 = Width/2 ; 


for(x 20;x < Height;x + + ) 


| 


for(y =0;y < Width;y + +) 


| 


// 锐 化 参数 ,可 调 


Dz(x-nl) * (x-nl) * (y-n2) * (y—-n2); 
Hz(1.1-0.1) * (1 -exp( -e* (D/(Width * Width) ) )) 40.1; 


fd re[x][ y] =H * fd re[ x][ y]; 
fd im[x][y] =H *fd im[x][ y]; 


void fft( ) 


| 


inf 1,],X;,y; 

int w,h; 

int wp,hp; 

int a, b ,€3 

int p, bfsize; 
double angle; 
double dtemp; 
double x, re,x. im; 
double ta ,tb ,tc , td ; 
w=l; 

hzl: 

wp 20; 

hp 20; 

while(2 * w < = Width) 
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| 
while(2*h < = Height) 
| 

h* z2; 

hp+ +; 
| 
for(i=0;i<h;i+ + )// 沿 x 轴 进 行 快速 傅立叶 变换 
| 

// 取 对 数 

for(j =0;j <w;j * +) 

| 

if(input[i] [j] = =0) 


for(j =0;j < (Width/2) ;j * +) 

| 
angle = —j * pi * 2/Width; 
wco, re| j] = cos( angle) ; 
wco, im[ j] = sin(angle) ; 

| 

for(a =0;a <wp;a+ +) 


| 
for(b=0;b<(1< <a);b+ +) 
| 
bfsize 21 < < (wp -a); 
for(c 20;c < ( bfsize/2) ;c + +) 
| 
p =b * bfsize; 
wx2_re[c +p] =wxl_re[c+p] + wxl re[ c +p + bfsize/2] ; 
wx2_im[c +p] =wxl_im[c +p] + wxl_im[c +p + bfsize/2] ; 


0 


ta=wxl_re[c+p] — wxl. re[ c +p * bfsize/2] ; 
tb 2 wxl, im[e +p] - wxl_im[c +p + bfsize/2 ] ; 
te 2 wco re[ c * (1< «a) ]; 

td 2 wco im[c* (1< «a) ]; 

wx2 re| c +p + bfsize/2] =ta * te — tb * td; 

wx2 im|[c +p + bfsize/2] =ta*td + tb tc; 


| 

for(c=0;c < Width;c + 4) 

| 
x re - wxl re[ c] ; 
x in -wxl im[c]; 
wxl re[c] 2 wx2 re[ c]; 
wxl im[c)] 2wx2 im[c]; 
wx2_rel c] 2x re; 
wx2 im[c] 2x im; 


| 
f 


for(b =0;b < Width;b + 4) 
| 
p =0; 
for(c =0;c <wp;c + +) 
| 
if(b & (1« «e)) 
| 
p+=l<<(wp-c-1); 


| 
fd_re[i][b] =wxl_re[ p]; 
fd_im[i][b] =wxl_im[p]; 
| 
| 
for(j =0;j <w;j + + )// 沿 y 轴 进 行 快速 傅立叶 变换 
| 
for(i=0;i<h;i+ +) 
| 
hxl_re[i| =fd_rel i] 


ls 
hxl_im[i] 2fd im[i][j 


IE 
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| 
for(i=0;i< (Height/2);i+ +) 
! 


angle = —i* pi*2/Height; 
hco re[ i] =cos(angle); 
hco, im[ i] =sin( angle) ; 
| 
for(a z0;a«hp;a-* +) 
| 
for(b =0;b<(1< <a);b+ +) 
| 
bfsize =1 < < (hp -a); 
for(c=0;c «(bfsize/2) ;c + +) 
| 
p =b * bfsize; 
hx2 re[ c +p] =hxl_re[c +p] + hxl_re[ c +p +pbfsize/2]; 
hx2_im[c +p] =hxl_im[c +p] + hxl_im[ c +p + bfsize/2]; 
ta=hxl_re[c+p] - hxl_re[c +p + bfsize/2] ; 
tb =hxl_im[c +p] - hxl_im[c +p + bfsize/2]; 
te -hco re[ c * (1< <a)]; 
td =hco_im[c * (1< <a)]; 
hx2_re[ c +p + bfsize/2] =ta * te — tb * td; 
hx2_im[ c +p + bfsize/2] =ta *td + tb * tc; 


| 

for(c 20;c < Height;c + +) 

| 
x re =hxl_rel c] ; 
x im z hxl. im[c]; 
hxl, re[ c] =hx2_rel c]; 
hxl_iml c] 2 hx2 im[ c]; 
hx2 re[c] 2x re; 
hx2 im[c] -x im; 


for(c 20;c «hp;e- +) 
| 
if(b & (1< <c)) 
| 
p+=l<<(hp-c-1); 


| 

fd re[ b] [j] =hxl_re[p]; 

fd im[b][j] 2hxl im[p]; 
| 


1 
j 
for(i =0;i < Height;i + +) 
| 
for( j z0;j < Width; j t +) 


| 
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dtemp = sqrt(fd re[i][j] *fd re[i][j] + fd im[i][j] *fd im[i][j])/100; 


if( dtemp » 255) 
| 

dtemp =255; 
| 


x = Height - 1 - (1 < Heigh/27 i + Height/2.;i— Height/2) ; 
y =j « Width/2 j + Width/2;j - Width/2; 
fdout[ x] [ y] = (unsigned char) ( dtemp) ; 


| 

void ifft( ) 

| 
int i,j; 
int w,h; 
int wp,hp; 
int a,b,c; 
int p ,bfsize ; 
double angle; 
double dtemp ; 
double x re,x im; 
double ta ,tb tc ,td ; 


w=l; 
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hzl; 
wp 20; 
hp 20; 


while(2 * w < = Width) 
| 
w* =2; 
wp++; 
| 
while(2*h < = Height) 
| 
h * z2; 
hp+ +; 
| 
for(i=0;i<h;i+ +)// 沿 x 轴 进 行 快速 傅立叶 变换 
| 
for(j =0;j <w;j+ +) 
| 
wxl_re[j] 2 fd re[i][j]; 
wxl im[j] 2 fd im[i][j]; 


for(j =0;j «wij * +) 
wxl im[j] = -wxl_im[j]; 


for(j 20;j < (Width/2) ;j * +) 





angle = -j * pi * 2/Width ; 
wco re[ j] = cos( angle) ; 
wco im| j] = sin( angle) ; 
| 
for(a=0;a <wp;a + +) 
| 
for(b =0;b< (1< <a);b+ +) 
| 
bfsize =1 < < (wp -a); 
for(c 20;c < ( bfsize/2) ;c + +) 
| 
p =b * bfsize; 
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wx2_re[ c +p] =wxl_re[c +p] + wxl_re[c +p+bfsize/2]; 
wx2_im[c +p] =wxl_im[c +p] + wxl_im[ c +p + bfsize/2 ] 
ta=wxl_re[c+p] - wxl_re[ c +p + bfsize/2] ; 

tb =wxl_im[c +p] - wxl_im[ c +p + bfsize/2] ; 

tc 2 wco re[ c * (1< <a)]; 

td 2 wco im[c* (1 « «a)]; 

wx2 re[ c p + bfsize/2] =ta *te — tb * td; 

wx2 im[c + p + bfsize/2] 2 ta *td + tb * tc; 


| 
for(c 20;c < Width;c + +) 
| 
x re =wxl_rel c]; 
x im 2 wxl. im[c); 
wxl re[ c] 2 wx2 re( c] ; 
wxl im[c] 2wx2 im[c]; 
wx2 re[c] 2x re; 
wx2 im[c] -x im; 


| 
for(b=0;b < Width;b + +) 
| 
p=0; 
for(c=0;c <wp;c+ +) 
| 
if(b & (1« «c)) 
| 
przl««(wp-ce-1); 
| 
| 
td_re[ ij[b] 2 wxl re[ p]; 
td im[i][b] 2 wxl, im[ p]; 
| 
for(j =0;j<Width;j+ +) 
| 
td. re[ 1][j] 2td re[ 1] [ j ]/Width; 
imi] eu imrO gr d 
| 
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| = 
for(j =0;j <w;j+ + )// 沿 y 轴 进 行 快速 傅立叶 变换 
| 
for(i=0;i<h;i+ +) 
| 
hxl_re[i] =td_re[i][ 


iJ jl; 
hxl_im[i] =td_im[i][j 


ji 
| 
for(i=0;i<h;i+ +) 
| 
hxl_im[i] = -hxl_im[i]; 
| 
for(i =0;i < (Height/2);i+ +) 
| 
angle = —i * pi* 2/Height; 
hco, re[ i] =cos(angle) ; 
hco im[i] = sin(angle); 
| 
for(a 20;a«hp;a- +) 
| 
for(b=0;b<(1< <a);b+ +) 
| 
bfsize =1 < < (hp -a); 
for(c =0;c < (bfsize/2);c + +) 
| 
p =b * bfsize; 
hx2 re[ c +p] =hxl_relc+p] + hxl re[ c +p * bfsize/2] ; 
hx2 im[c +p] =hxl_im[c +p] + hxl im[ cp + bfsize/2]; 
ta zhxl re[ c p]. - hxl re[ e +p * bfsize/2 | ; 
tb =hxl_im[c +p] - hxl, im[ c +p + bfsize/2]; 
tc -hco re[ c * (1 « «a) ]; 
td =hco_im[c* (1< «a) ]; 
hx2 re[ c +p + bfsize/2] =ta * te — tb * td; 
hx2 im[ c +p + bfsize/2] =ta *td + tb * tc; 


| 


for(c 20;c «Height;c + +) 


! 
I 
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x re =hxl_rel c]; 
x im z hxl. im[c]; 
hxl re[ c] 2 hx2 re[ c] ; 
hxl_im[ c] =hx2_im[ c]; 
hx2_rel c] 2x re; 
hx2 im[c] 2x im; 
| 
for(b =0;b < Height;b+ +) 
| 
p-0; 
for(c 20;c «hp;c + +) 
| 
if(b & (1« «c)) 
| 
p+=1<<(hp-c-1); 
| 
| 
td_re[ bj][j] =hxl_re[ p]; 
td im[ b][j] =hxl_im[p]; 
| 
for(i =0;i < Height;i + + ) 
| 
td_re[i][j] =td_re[i][j]/Height; 
td_im[i][j] = -td_im[i][j]/Height; 


| 
for(i =0;i < Height;i + +) 
| 
for(j 20;j < Width;j + +) 
| 
dtemp 2 td. re[ i][j]; 
dtemp =60 * exp( dtemp) ; 
if( dtemp » 255) 
| 
dtemp 2255; 
| 
tdout[ i][j] = (unsigned char) ( dtemp) ; 
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| 

ccs 仿真 设置 

选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗 口 ,右键 单 击 图 像 窗 口 选 择 Proper- 
ties 进行 图 像 显示 配置 ,设置 如 图 5-9 所 示 。 

(4) 实验 结果 

处 理 过 程 如 图 5-51 所 示 ,图 5-51a) 为 原始 图 像 , 可 以 看 出 由 于 光照 不 均 图 像 右 侧 存在 大 
量 黑色 区 域 无 法 辨识 ,图 5-51b ) 为 原始 图 像 数据 经 过 指数 处 理 和 快速 傅立叶 处 理 之 后 的 频谱 
图 ,图 5-51c) 为 同 态 滤波 处 理 之 后 的 图 像 。 实 验 结果 表明 , 同 态 滤波 有 效 的 改善 了 图 像 的 视 





——— 


a) 原始 图 像 b 频谱 图 





图 5-51 CCS 同 态 增 晰 


5.7 彩色 增强 


历史 上 的 图 像 处 理 , 最 先 选用 灰 度 图 像 做 输入 。 但 自然 界 是 五 颜 六 色 的 , 且 彩 色 图 像 包 含 
更 多 的 信息 ,与 人 类 的 感知 更 加 相符 。 伴 随 着 生活 水 平 的 提高 ,人 们 逐步 对 彩色 图 像 处 理 越 来 
越 感 兴趣 ,而 科技 的 迅猛 发 展 又 为 彩色 图 像 处 理 提 供 了 强 有 力 的 保障 。 
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彩色 图 像 处 理 技术 是 从 可 视 性 角度 实现 图 像 增 强 的 有 效 方法 之 一 。 彩 色 图 像 具 有 比 灰 度 
图 像 更 为 复杂 的 特性 ,往往 用 矢量 来 表示 像素 ,上 且 矢 量 的 各 个 分 量 相关 性 很 高 ,这 就 加 大 了 彩 
色 图 像 增 强 的 难度 。 对 于 灰 度 图 像 ,人 眼 能 分 辩 的 灰 度 级 只 有 十 几 到 二 十 几 , 而 对 不 同 亮度 和 
色调 的 彩色 图 像 则 能 达到 几 百 甚至 上 千 。 例 如 当 彩 色 电视 从 彩色 显示 调 到 黑白 显示 时 ,原来 
能 看 到 的 一 些 画面 细节 就 看 不 出 来 了 ,利用 人 类 视觉 系统 的 这 一 特性 ,将 颜色 信息 用 于 图 像 增 
强 之 中 能 提高 图 像 的 可 分 辨 率 。 将 灰 度 图 像 变 成 彩色 图 像 ,或 者 改变 已 有 的 颜色 分 布 ,都 能 够 
改善 图 像 的 可 视 性 ,彩色 增强 方法 一 般 可 分 为 伪 彩色 增强 方法 和 真 彩色 增强 方法 。 

5.7.1 伪 彩 色 增 强 


伪 彩 色 处 理 是 指 将 黑白 图 像 转化 为 彩色 图 像 ,或 者 是 将 单 色 图 像 变 换 成 给 定 彩色 分 布 的 
图 像 。 由 于 人 眼 对 彩色 的 分 辨 能 力 远 远 高 于 对 灰 度 的 分 辩 能 力 , 所 以 将 灰 度 图 像 转化 成 彩色 ， 
可 以 提高 对 图 像 细 节 的 辨别 能 力 。 因 此 , 伪 彩 色 处 理 的 主要 目的 是 为 了 提高 人 眼 对 图 像 的 细 
节 分 辩 能 力 ,以 达到 图 像 增强 的 目的 。 

伪 彩 色 增 强 图 像 是 将 人 眼 不 能 区 分 的 微小 的 灰 度 差别 显示 为 明显 的 色彩 差异 ,更 便于 解 
译 和 提取 其 有 用 信息 。 甚 基本 原理 是 将 黑白 图 像 的 各 个 灰 度 级 匹配 到 彩色 空间 中 的 一 点 ,从 
而 使 单 色 图 像 映射 成 彩色 图 像 。 对 黑白 图 像 中 不 同 的 灰 度 级 赋予 不 同 的 彩色 。 

设 f(x,y) 为 一 幅 黑 白 图 像 ,R(x,y) Gy) BG y) H f(x, y) RITE RGB 空间 的 3 个 颜 
色 分 量 , 则 伪 彩 色 处 理 可 表示 为 : 


R(x,y) sf s.) 
G(x,y) fs (Gs y) (5-77) 
(x,y) —fa(f(my)) 


HP Lf SoSo 为 某 种 映射 函数 。 给 定 不 同 的 映射 函数 就 能 将 灰 度 图 像 转化 为 不 同 的 伪 
彩色 图 像 。 需 要 注意 的 是 , 伪 彩 色 虽 然 能 将 黑白 灰 度 转化 为 彩色 ,但 这 种 彩色 并 不 是 真正 表现 
图 像 的 原始 颜色 ,而 仅仅 是 一 种 便于 识别 的 伪 彩 色 。 在 实际 应 用 中 ,通常 是 为 了 提高 图 像 分 辨 
率 而 进行 伪 彩 色 处 理 , 所 以 应 采用 分 辨 效果 最 好 的 映射 函数 。 伪 彩色 增强 的 方法 主要 有 以 下 
三 种 : 

1. 灰 度 级 一 彩色 变换 法 

空间 域 灰 度 级 一 彩色 变换 是 一 种 常用 的 、 比 密度 分 割 更 有 效 的 伪 彩 色 增 强 方法 。 它 根据 
色 度 学 的 原理 ,将 源 图 像 的 灰 度 分 段 经 过 红 \ 绿 、 蓝 三 种 不 同 的 变换 , 变 成 三 基色 分 量 , 然 后 用 
它们 分 别 控制 彩色 显示 需 的 红 ` 绿 、 蓝 电子 枪 , 便 可 以 在 彩色 显示 器 的 屏幕 上 合成 一 幅 彩 色 
图 像 。 

这 种 伪 彩 色 处 理 技术 可 以 将 灰 度 图 像 变换 为 具有 多 种 颜色 渐变 的 连续 彩色 图 像 ,其 方法 
是 先 将 灰 度 图 像 f(x,y) 送 入 具有 不 同 变换 特征 的 红 、 绿 、 蓝 三 个 变换 器 ,然后 再 将 三 个 变换 器 
的 不 同 输出 R(x,y) .G(x,y) .B(x,y) 分 别 送 到 彩色 显像管 的 红 、 绿 、 蓝 电子 枪 ,这 样 就 可 得 到 
其 颜色 内 容 由 三 个 变换 函数 调制 的 与 f(x,y) 幅度 相对 应 的 彩色 混合 图 像 。 这 里 受 调制 的 是 
像素 的 灰 度 值 而 不 是 像素 的 位 置 。 对 于 同一 个 灰 度 级 ,由 于 三 个 变换 器 对 其 实施 不 同 的 变换 ， 
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on 因此 三 个 变换 器 的 输出 不 同 ,在 彩色 显像管 里 合成 某 

一 种 彩色 ,而且 对 不 同 大 小 灰 度 级 可 以 合成 不 同 彩 
Gay) 色 。 灰 度 级 彩色 变换 的 示意 图 如 图 5-52 所 示 。 

一 组 典型 的 灰 度 级 一 彩色 变换 的 传递 函数 如 图 

BG) 5.53 所 示 , 其 中 图 5-53a) b) c) 分 别 表 示 红 色 、 绿 

图 5-52 ” 灰 度 级 一 彩色 变换 法 原理 示意 图 。 色 、 蓝 色 的 传递 函数 ,图 5-53d) 是 三 种 彩色 传递 函数 

组 合 在 一 起 的 情况 。 下 面 对 图 5-53a ) 的 变换 函数 加 以 说 明 , 其 余 类 推 。 由 图 5-53a) 可 见 , 凡 

灰 度 级 小 于 L/2 的 像素 将 被 转变 为 尽 可 能 暗 的 红色 ,而 灰 度 级 位 于 L/2 -3L/4 之 间 的 像素 则 

取 红 色 从 暗 到 亮 的 线性 变换 。 凡 灰 度 级 大 于 3L/4 的 像素 均 被 转变 成 最 亮 的 红色 。 


fo») 





红 绿 

工 L 

0 LA L2 3L4 L foy) 0 LA 712 314 L fy) 
a) 红色 变换 特性 b) 绿 色 变 换 特性 

蓝 





LA L2 3L4^ L fJ 0 L4 L2 314 L fy 
c) 蓝 色 变换 特性 d) 合成 特性 


eo 


[Kd 5-53 ”典型 变换 函数 

2. 密度 分 割 法 

密度 分 割 是 伪 彩 色 图 像 增 强 技术 中 原理 最 简单 操作 最 简便 的 一 种 方法 ,又 称 为 强度 分 
38] , 它 是 对 图 像 的 灰 度 值 动态 范围 进行 分 割 ,使 分 割 后 的 每 一 灰 度 值 区 间 甚 至 每 一 灰 度 值 本 身 
对 应 某 一 种 颜色 。 密 度 分 层 法 可 看 成 是 放置 一 些 平行 于 图 像 坐 标 面 的 平面 ,然后 每 一 个 平面 
在 相交 的 区 域 中 切割 此 密度 函数 。 如 果 对 切割 平面 的 每 一 面 赋 以 不 同 的 颜色 , 即 平面 之 上 任 
何 灰 度 级 的 像素 被 编码 成 一 种 颜色 ,平面 之 下 任何 灰 度 级 像素 被 编码 成 男 一 种 颜色 ,其 结果 就 
是 一 副 两 色 图 像 。 
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设 一 幅 灰 度 图 像 f(x,y) ,在 某 一 灰 度 级 如 f(x,y) = 上 设置 一 个 平行 于 xy 平面 的 切割 
面 ,其 剖面 图 如 图 5-54 所 示 。 这 幅 灰 度 图 像 被 切割 成 只 有 两 个 灰 度 级 ,对 切割 平面 以 下 的 , 即 
灰 度 级 小 于 1, 的 像素 分 配 一 种 颜色 (如 蓝 色 ); 相 应 oL 
地 ,对 切割 平面 以 上 的 , 即 灰 度 级 大 于 1 的 像素 分 配 另 


一 种 颜色 (如 红色 ) 。 这 样 切割 的 结果 就 可 以 将 灰 度 图 

像 变 为 只 有 两 个 颜色 的 伪 彩 色 图 像 。 JC sm ON 
如 果 用 V 个 平面 去 切割 图 像 , 则 可 以 得 到 N+1 个 ” 

灰 度 值 区间 , 每 个 区 间 对 应 一 种 颜色 C,。 对 于 每 一 像 ne 


Z6 (x,y) , WR I, , Sf(x,y) SL, M g(x,y) =C, i=1, 
2,…,N,g(x,y) 和 f(x,y) 分 别 表示 变换 后 的 彩色 图 像 

和 原始 灰 度 图 像 。 这 样 可 以 把 一 幅 灰 度 图 像 变 成 一 副 o fo») 
伪 彩 色 图 像 。 此 法 比较 直观 简单 ,缺点 是 变换 出 彩色 图 5-54 密度 切割 的 剖面 示意 图 

的 数目 有 限 。 

应 当 指 出 ,每 一 灰 度 值 区 间 赋 予 任何 颜色 ,是 由 具体 应 用 决定 的 ,并 无 规律 可 言 。 但 总 的 
来 讲 , 相 邻 灰 度 值 区间 的 颜色 差别 不 宜 太 大 也 不 宜 太 小 , 太 小 无 法 反映 细节 上 的 差异 , 太 大 则 
会 导致 图像 出 现 不 连续 性 。 实 际 应 用 中 ,密度 切割 平面 之 间 可 以 是 等 间隔 的 ,也 可 以 是 不 等 间 
隔 的 ,而 且 切割 平面 的 划分 也 应 依据 具体 的 应 用 范围 和 研究 对 象 而 确定 。 

3. 频率 滤波 法 

在 频率 滤波 法 中 , 伪 彩 色 图 像 的 彩色 取决 于 黑白 图 像 的 空间 频率 。 据 此 ,可 将 原始 图 像 
GR EL) 中 感 兴趣 的 空间 频率 成 分 以 某 种 特定 的 彩色 表示 。 设 计 3 种 不 同 滤波 功能 的 滤波 器 ， 
对 原始 黑白 图 像 进 行 滤波 ,3 个 滤波 器 的 输出 经 过 适当 的 处 理 , 作 为 彩色 输出 设备 的 红 、 绿 、 蓝 
三 原色 输入 ,最 后 输出 该 原始 黑白 图 像 的 频率 分 布 形 成 的 伪 彩 色 图 像 。 频 率 滤波 法 的 原理 如 










框图 5-55 所 示 。 
m ret * 
色 
fy) & 
器 





图 5-55 ”频率 滤波 法 实现 伪 彩 色 处 理 示意 图 


伪 彩 色 处 理 技 术 有 着 广泛 的 实际 应 用 价值 ,例如 图 像 的 区 域 分 离 显示 ,彩色 印刷 制版 方面 
的 应 用 等 , 伪 彩 色 图 像 处理 技 术 不 仅 适 用 于 航拍 和 遥感 图 片 ,还 可 以 用 于 X 射线 片 及 云图 判 
读 等 方面 ,实现 的 手段 可 以 用 计算 机 ,也 可 以 用 专用 的 硬件 设备 。 

5.7.2 伪 彩 色 增 强 的 实现 

本 节 将 结合 上 述 理论 给 出 具体 的 实现 方法 ,包括 Matlab 仿真 实现 以 及 基于 C 语言 
DM642 代码 ,以 便 读 者 深入 了 解 伪 彩色 增强 的 基本 概念 及 其 特点 ,掌握 其 实现 方法 。 
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1. Matlab 仿真 实现 

(1) 灰 度 级 一 彩色 变换 M 文件 源 代 码 及 仿真 结果 
DM 文件 代码 

I = imread( 'G: \Peppers. tif' ) ; 

figure(1); 

imshow( I) ; 

I = double( I) ; 

[M,N] 2size(I) ; 


L 2-256; 
for i=1:M 
for j =1:N 
if I(i,j) <L/4 
R(i,j) =0; 
GCi,j) 24 *1(i,j)s 
B(i,j) =L; 
else 
if I(1,]) «€ L2 
R(i,j) 20; 
G(i,j) =L; 
B(ij)2 -4*1(1,) +2 *L; 
else 
if I(i,j) < 23* 17/4 
R(i,) 24*1(i,j) -2*L; 
G(i,j) =L; 
B(i,j) =0; 
else 
R(i,j) =L; 
G(ij) = -4*I(i,j) *4*L; 
BG,j) -0; 
end 
end 
end 
end 
end 
fori 21:M 
for j 21:N 


J(i,j,1) 2 R(,); 
J(i,j,2) =G(i,j); 
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J(i,j,3) 2B(i); 
end 
end 
G2D 2/256; 
figure(2) ; 
imshow ( G2D) ; 


@) 处 理 结果 
灰 度 级 一 彩色 变换 如 图 5-56 所 示 。 









“二 原始 图 像 | b) 处 理 后 图 像 
图 5-56” 灰 度 级 一 彩色 变换 





(2) 密 度 分 割 法 的 M 文件 
(DM 文件 代码 
I = imread('G:\Peppers.tif ) ; 
figure(1); 
imshow( I) ; 
I 2 double( I) ; 
[M,N] zsize(I) ; 
for i=1:M 
for j =1:N 
if I(1,j) «85 
R(i,j) 2202; 
G(1,j) 259; 
B(i,j) 241; 
else 
IET T) xm 70 
EG) 9121; 
Gii j) «120; 
B(i,j) =80; 
else 
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R(i,j) =179; 
G(i,j) 2203; 
B(i,j) -122; 


end 
end 
end 
end 
for 1=1.M 
for ] =1:N 
J(i,j,1) =R); 
J(i,j,2) =G(i,j); 
J(i,j,3) 2B(i,j) ; 
end 
end 


G2D = J/256; 

figure(2) ; 

imshow( G2D) ; 

@) 处 理 结果 

密度 分 割 法 处 理 结 果 如 图 5-57 所 示 。 










0 RR b) 处 理 后 图 像 
图 5-57 ”密度 分 割 法 
(3 ) 频 率 滤波 法 的 M 文件 及 仿真 结果 
(DM 文件 代码 
I = imread('G:\Peppers.tif ) ; 
figure ;imshow( I) ; 
xlabel('(a) 原始 图 像 ) ; 
[M,N] =size( I1); 
F =fft2 (1I); 
fftshift( F ) ; 
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REDeut = 100 ; 
GREENcut - 200; 
BLUEcenter = 150; 
BLUEwidth = 100; 
BLUEuO = 10; 
BLUEv0 = 10; 
foruz1:M 
for v Z 1:N 
D(u,v) 2sqrt(u2 * v2); 
REDH(u,v) 21/((1 *sqrt(2) -1) * (D(u,v)/REDout)^2) ; 
GREENH(u,v) =1/( (1 *sqrt(2) -1) * (GREENcut/D(u,v))2) ; 
BLUED(u,v) =sqrt( (u - BLUEu0)2 + (v - BLUEv0)^2) ; 
BLUEH(u,v) 21 - 1/(1 + BLUED (u,v) * BLUEwidth/( ( BLUED(u,v))^2 - 
( BLUEcenter ) 2) ^2) ; 
end 
end 
RED = REDH. *F; 
REDoolor = ifft2 ( RED) ; 
GREEN = GREENH. * F; 
GREENoolor = iffi2 ( GREEN ) ; 
BLUE - BLUEH. *F; 
BLUE color = iffi2( BLUE) ; 
REDoolor = real ( REDcolor) /256 ; 
GREENcolor = real ( GREENcolor) /256 ; 
BLUEcolor = real ( BLUEcolor) /256 ; 
for 1=1:M 
for j =1:N 
OUT(i,j,1) =REDcolor(i,j); 
OUT(i,j,2) =GREENcolor(i,j); 
OUT(i,j,3) = BLUEocolor(1,j) ; 
end 
end 
OUT - abs( OUT) ; 
figure;imshow( OUT) ; 
xlabel( (b) 频 域 伪 彩 色 处 理 后 的 图 像 ) ; 
QW EZ RR 
频率 滤波 法 处 理 结 果 如 网 5-58 所 示 。 
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a) 原始 图 像 
图 5-58 ”频率 滤波 法 
2. DM642 的 算法 实现 


这 里 基于 TMS320DM642 DSP 平台 给 出 伪 彩 色 增强 算法 的 C 语言 实现 。 
(1) 灰 度 级 一 彩色 变换 

QO 程序 代码 

#include < stdio. h > 

#include < math. h > 

#include < stdlib. h > 

#define L 256 

#define IMAGEWIDTH 512 

#define IMAGEHEIGHT 384 

#define Uint8 unsigned char 

void ReadImage( char * cFileName ) ; 

void bmpDataPart( FILE * fpbmp ) ; 

void Grayscale. Color( ) ; 

#pragma DATA. SECTION( grey," . my. sect" ) 
#pragma DATA, SECTION(R,," . my, sect" ) 

#pragma DATA, SECTION( G," . my. sect" ) 

#pragma DATA, SECTION( B," . my. sect" ) 

unsigned char grey| IMAGEHEIGHT | | IMAGEWIDTH | ; 
unsigned char R| IMAGEHEIGHT | [ IMAGEWIDTH | ; 
unsigned char G( IMAGEHEIGHT | | IMAGEWIDTH |; 
unsigned char B[ IMAGEHEIGHT | | IMAGEWIDTH | ; 
void main( ) 


/* 图 像 */ 
ReadImage("C:\\peppers. bmp" ) ; 
Grayscale_Color( ) ; 
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while (1); 
| 
void ReadImage( char * cFileName ) 
| 
FILE * fp; 
if ( fp =fopen(cFileName," rb" ) ) 
| 
bmpDataPart( fp ) ; 
fclose( fp) ; 


| 
void bmpDataPart(FILE * fpbmp) 


| 
l 


int i, j 20; 
unsigned char * pix 2 NULL; 
fseek (fpbmp, 1078L, SEEK SET) ; 
pix = (unsigned char * ) malloc( IMAGEWIDTH ) ; 
for(j 20;j «IMAGEHEIGHT;; + +) 
| 
fread (pix, 1, IMAGEWIDTH , fpbmp) ; 
for(i =0;i < IMAGEWIDTH ;i- +) 
| 
grey| IMAGEHEIGHT -1 -j] [i]  -pix[i]; 
| 


| 
void Grayscale_Color( ) 
| 
int 1,j; 
for(i =0;i «IMAGEHEIGHT;i + +) 
| 
for(j =0;j < IMAGEWIDTH;j + +) 


| 
if(grey[i][j] < L/4) 








R[i][j] 20; 
G[i][j] 24 * geyL i] [j]; 
B[i][j] L-1; 
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else if(grey[ i][j] < L/2) 


R[i][j] 20; 
G[i]lj] 3L-1; 
B[i][j] = -4*grey[i][j] *2*L; 


else if(grey[ i][j] < 3*L/4) 

| 
R[iJ[j] 24 * gey[ i] [j] -2 * L; 
G[il[j] 2L-1; 
B[i][j] 20; 

| 

else 


H 
| 


R[i][j] 2L-1; 
G[il[j] = -4*grey[ i][j] *4 *L; 
B[i][j] 20; 


| 


f 
Decs 仿真 设置 
选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗口 ,右键 单 击 图 像 窗 口 选 择 
Properties 进 行 图 像 显 示 配 置 , 设 置 如 图 5-9 所 示 。 
(3 实验 结果 (图 5-59) 








a) 原始 图 像 b) 处 理 后 图 像 


K 5-59 灰 度 级 -彩色 变换 


— 194 — 


(2) 密 度 分 割 法 
中 程序 代码 
#include < stdio. h > 
#include < math. h > 
#include < stdlib. h > 
#define IMAGEWIDTH 512 
#define IMAGEHEIGHT 384 
#define Uint8 | unsigned char 
void ReadImage( char * cFileName) ; 
void bmpDataPart( FILE *  fpbmp) ; 
void DensitySplit( ) ; 
#pragma DATA, SECTION( grey," . my, sect" ) 
#pragma DATA, SECTION( R,". my. sect" ) 
#pragma DATA, SECTION( G," . my. sect" ) 
#pragma DATA, SECTION( B,". my. sect" ) 
unsigned char grey[ IMAGEHEIGHT | | IMAGEWIDTH | ; 
unsigned char R[ IMAGEHEIGHT | | IMAGEWIDTH | ; 
unsigned char G[ IMAGEHEIGHT | | IMAGEWIDTH | ; 
unsigned char B[ IMAGEHEIGHT | | IMAGEWIDTH | ; 
void main( ) 
| 

/* 图 像 */ 

Readlmage( "G:\\Peppers. bmp" ) ; 

DensitySplit( ) ; 

while (1); 
| 
void ReadImage( char * cFileName) 
| 

FILE *fp; 

if ( fp=fopen(cFileName,"rb" ) ) 
| 
bmpDataPart ( fp) ; 
fclose( fp) ; 


| 
void bmpDataPart(FILE * fpbmp) 


| 
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int i, j 20; 
unsigned char * pix = NULL; 
fseek (fpbmp, 1078L, SEEK SET) ; 
pix = (unsigned char * ) malloc ( IMAGEWIDTH ) ; 
for(j =0;j < IMAGEHEIGHT;j + +) 
| 
fread( pix, 1, IMAGEWIDTH , fpbmp) ; 
for(i =0;i < IMAGEWIDTH ;i + +) 
| 
grey[ IMAGEHEIGHT -1 -j] [i] z pix[i]; 


| 
void DensitySplit( ) 
| 
int i,j; 
for(i =0;i < IMAGEHEIGHT;i + +) 
| 
for(j 20;j «IMAGEWIDTH ;j + +) 
| 
if(grey[i][j] < 85) 





else if(grey[ 1][j] < 170) 
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| 

ces 仿真 设置 

选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗口 ,右键 单 击 图 像 窗 口 选择 Proper- 
ties 进行 图 像 显 示 配 置 , 设 置 与 第 5.2.3 节 中 图 5-9 一 致 。 

3 实验 结果 (图 5-60) 








a) 密度 分 割 法 原始 图 像 b) 处 理 后 图 像 
图 5-60 ”密度 分 割 法 


5.8 本章 小 结 


本 章 从 经 典 的 灰 度 变 换 入 手 ,着 重 介 绍 了 灰 度 线性 、 非 线性 变换 和 直方 图 修正 、 均 衡 化 方 
法 ,对 图 像 平 滑 和 锐 化 的 原理 和 方法 进行 了 详细 的 说 明 , 并 给 出 了 部 分 滤波 算法 代码 , 除 此 之 
外 还 介绍 了 彩色 增强 的 基本 概念 和 方法 。 





1. 简 述 灰 度 变换 的 基本 方法 。 

2. 令 原 图 像 Fx,y) 的 灰 度 范围 为 [50 ,80 ] ,线性 变换 后 图 像 g(x,y) 的 范围 为 [20,180] , 
写 出 Kx,y) 与 g(x,y) 之 间 存 在 的 变换 公式 。 

3. 简 述 灰 度 统计 直方 图 在 数字 图 像 处 理 中 的 应 用 。 

4. 试 自行 设计 一 个 加 权 平 均 滤波 器 ,并 讨论 不 同 的 权 值 对 滤波 效果 的 影响 ? 

5. 试 画 出 几 种 高 通 滤波 器 的 特性 曲线 。 

6. 试 讨 论 用 于 图 像 平滑 处 理 的 滤波 器 和 用 于 锐 化 处 理 的 滤波 器 的 联系 和 区 别 ? 若 图 像 中 
AVERE CUR 255) ,如 下 面 的 表格 所 示 , 是 问 该 采取 那 种 滤波 器 ,不 同 的 滤波 器 有 哪 
些 不 同 ? 
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t 2 3 5 
d. 459 (8 9 
6' «5. .255 

3 «3 3 255 
9 255 9 


7. 简 述 平滑 处 理 的 基本 方法 。 

8. 简 述 消除 孤立 黑 像 素 点 的 基本 方法 。 

9. 简 述 N x N 均值 滤波 器 的 实现 方法 并 编程 实现 。 
10. 简 述 N x N 中 值 滤波 器 的 实现 方法 并 编程 实现 。 
11. 简 述 十 字形 中 值 滤波 器 的 实现 方法 并 编程 实现 。 


=S 
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6.1 前 言 


图 像 分 割 是 将 采集 到 的 图 像 分 割 成 具有 不 同 特征 目标 区 域 的 过 程 ,是 图 像 处 理 的 关键 步 又 ,图 
像 描述 ,特征 提取 目标 识别 等 都 和 图 像 分 割 质量 的 高 低 密切 相关 。 图 像 分 割 将 底层 处 理 和 高 
层 处 理 联 系 到 一 起 ,其 目的 在 于 将 图 像 划 分 为 与 真实 世界 相对 应 的 互 不 重合 区 域 集合 ,实现 图 
像 中 感 兴趣 目标 和 其 他 区 域 的 分 离 , 从 而 可 以 对 感 兴 趣 目 标 采用 跟踪 、 检 测 、 识 别 等 处 理 。 

目前 ,研究 者 提出 了 上 千 种 的 图 像 分 割 方法 ,其 中 , 阐 值 分 割 以 其 简约 和 高 度 实用 的 特性 
得 到 长 期 广泛 的 应 用 。 经 过 了 几 十 年 的 发 展 ,若干 卓有成效 的 阔 值 分 割 算法 被 不 断 提 出 ,采用 
不 同 数学 模型 从 不 同 视角 切 人 的 方法 在 特定 的 图 像 处 理 任 务 中 均 取 得 了 一 定 效果 。 然 而 ,由 
于 自然 图 像 的 复杂 性 和 噪声 干扰 等 问题 ,图 像 分 割 仍然 是 一 个 非常 具有 挑战 性 的 课题 。 本 章 
详细 介绍 了 基于 灰 度 阔 值 的 方法 、 基 于 边缘 的 方法 和 基于 区 域 的 分 割 方法 ,来 详细 介绍 典型 的 
图 像 分 割 方法 。 


6.2 REDES 


6.2.1 阅 值 分 割 的 原理 


灰 度 闵 值 分 割 方法 是 图 像 分 割 的 一 个 研究 热点 。 立 值 分 割 方法 广泛 应 用 于 目标 和 背景 的 
像素 灰 度 级 存在 明显 差距 的 图 像 分 析 应 用 场合 ,典型 应 用 包括 提取 文本 图 像 中 的 字符 与 标记 ， 
提取 地 图 图 像 中 的 标识 ,场景 图 像 中 的 目标 ,材料 质量 检测 过 程 中 的 缺陷 部 位 标识 ,细胞 图 像 
处 理 , 热 图 像 处 理 ,无 损 测试 ,视频 时 空 图 像 分 割 等 。 

灰 度 阐 值 法 是 把 图 像 的 灰 度 分 成 不 同 的 等 级 ,然后 用 设置 灰 度 立 值 的 方法 确定 有 音义 的 
区 域 或 欲 分 割 物体 的 边界 ,其 基本 思想 是 在 图 像 最 小 灰 度 gw 和 最 大 灰 度 gu。 之 间 确 定 一 个 交 
IE Tl gmin < T< En) ,然后 将 图 像 中 所 有 像素 按 其 灰 度 级 以 该 国 值 为 界 进行 分 类 。 该 方法 中 
最 简单 的 就 是 二 值 化 的 闵 值 分 割 。 

一 幅 图 像 包 括 目标 背景 和 噪声 ,在 不 同 的 应 用 场合 ,图 像 处理 任 务 感 兴趣 区 域 不 同 ,一 般 
将 感 兴趣 的 一 类 称 之 为 目标 。 如 在 文档 图 像 的 二 值 化 中 目标 一 般 是 指 灰 度 低 于 阔 值 的 文字 像 
素 , 而 在 红外 目标 检测 中 则 相反 。 因 此 在 各 种 阔 值 方法 中 ,如 何 根据 适当 的 法 则 确定 合适 的 阔 
值 , 使 得 阐 值 分 割 后 的 目标 背景 分 类 符合 图 像 分 割 定义 准则 ,是 这 类 方法 的 关键 。 如 何 从 灰 度 
图 像 中 提取 出 有 价值 部 分 是 本 章 要 解决 的 问题 。 

设 定 某 一 冰 值 7, 可 以 将 图 像 的 数据 分 成 两 部 分 :大 于 7 的 像素 群 和 小 于 7 的 像素 群 , 例 
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如 输入 图 像 为 f(x,y) ,输出 图 像 为 g(x,y) , 则 : 


wel fíx,y)mT 
x,y) = ] 6-1 
sen = a fay) <T i3 
或 
FEES foy) =T 
g(x,y) = E pu e (62) 


3 RUP. BAT RUE 7, 以 此 为 依据 将 像素 点 的 灰 度 值 划分 为 两 类 ,这 就 是 图 像 二 值 化 处 理 ， 
也 就 是 国 值 分 割 , 进 而 将 图 像 f(x,y) 分 成 对 象 物 和 背景 两 个 区 域 。 

由 于 自然 图 像 的 复杂 性 ,实际 得 到 的 图 像 目 标 和 背景 之 间 不 一 定单 纯 地 分 布 在 两 个 灰 度 
范围 内 ,此 时 需要 两 个 或 以 上 的 浆 值 来 提取 目标 。 而 通常 所 说 的 经 典 冰 值 分 割 一 般 是 指 单 冰 
值 分 割 。 比 如 选择 一 个 区 间 ( 7 ,7 ) 作 为 阔 值 ,用 下 面 两 个 公式 进行 经 典 图 像 二 值 化 处 理 . 


T, x 9 T, 
g(x,y) = b a g (63) 
或 
| 其 他 
ger) E à T, xm f(x,y) x T, kot) 
6.2.2 WAH 


国 值 选取 是 一 种 区 域 分 割 技术 ,对 物体 与 背景 有 较 强 对 比 的 景物 分 割 非 常 有 用 。 但 由 于 
图 像 信息 本 身 的 复杂 性 ,分割 结果 满足 所 有 分 割 定义 且 视觉 效果 良好 的 图 像 阔 值 选取 目前 仍 
是 一 大 挑战 ,因此 怎样 进行 浆 值 选择 是 一 个 比较 难 的 问题 。 在 数字 化 的 图 像 数 据 中 ,无 用 的 背 
景 数据 和 对 象 物 的 数据 常常 混在 一 起 。 除 此 之 外 ,在 图 像 中 还 含有 各 种 噪声 。 所 以 必须 根据 
图 像 的 统计 性 质 , 即 从 概率 的 角度 来 选择 合适 的 冰 值 。 下 面 介绍 两 种 阔 值 选择 方法 。 

1. 和 迭代 分 析 法 

迭代 分 析 法 首先 选择 一 个 近似 阔 值 了 ,将 图 像 分 割 成 两 部 分 尺 A R ,计算 区 域 R FR, 的 均 
fÈ u, 和 人 ,选择 新 的 分 割 装 值 了 = (上 + 人 )/2 ,重复 上 述 步 又 直到 上 和 不 再 变化 为 止 。 

迭代 法 是 基于 逼近 的 算法 ,其 步骤 如 下 : 

(1) 求 出 图 像 的 最 大 灰 度 值 和 最 小 灰 度 值 ,分 别 记 为 Cu 和 Guino S EU a BRE T = C, 


和 Co 
(2) RH E 了 将 图 像 分 割 为 前 景 和 背景 ,分 别 求 出 两 者 平均 灰 度 ForegroundMean 和 
BackgroundMean。 


(3) 求 出 新 闻 值 了 = (ForegroundMean + BackgroundMean ) /2., 
(4) 若 阔 值 了 不 再 变化 , 则 了 即 为 冰 值 ,否则 转 (2) 和 迭代 计算 。 
2. 最 大 方差 阅 值 
最 大 方差 闪 值 也 叫 大 津 姜 值 ( Otsu) ,是 1980 年 由 日 本 的 大 津 展 之 提出 的 。 它 是 在 判别 与 
最 小 二 乘法 原理 的 基础 上 推导 出 来 的 ,对 于 目标 背景 类 的 图 像 分 割 效 果 是 比较 好 的 ,而 且 算 法 
简单 ,具有 一 定 的 自 适 应 能 力 , 因 此 适用 范围 也 较 广 。 其 阔 值 选取 原则 :把 直方 图 在 某 一 阔 值 
TEES 
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处 分 割 成 两 组 , 当 被 分 成 的 两 组 间 方 差 为 最 大 时 ,确定 阔 值 。 现 在 , 设 一 幅 图 像 的 灰 度 值 为 
1 ^ m, JKBE( i 的 像素 数 为 n, ,此 时 得 到 
像素 总 数 


N= Xn, (6-5) 
各 值 的 概率 
(6-6) 


然后 用 了 将 其 分 成 两 组 C = 11 - TI RIC, S IT 1 ml ,各 组 产生 的 概率 如 下 : 
C, 产生 的 概率 








Wo = X» -w(T) (6-7) 
C, 产生 的 概率 
Me E Pi =1 -w (6-8) 
Cu 的 平均 值 
有 人 CD) 
Ho - X ) w(T) (6-9) 
C, 的 平均 值 
m= $ Bam (6-10) 


RP u= ip, 是 整体 图 像 的 灰 度 平均 值 ;(7) = Dip, ERE TEREF, Pi 
以 全 部 采样 的 灰 度 平均 值 为 : 


HK=woKo + WU, (6-11) 

两 组 间 的 方差 用 式 (6-12) 求 出 : 
8 (T) =wo (po -4)° +w, (u, - 9)! =wow (y, =m) (6-12) 
从 1~m 改变 7, 求 上 式 为 最 大 值 时 的 7, 即 求 maxé^ ( T) EE] T^ (E, ERF, T" EE BE, 


8 (T) ERER 

在 Otsu 准则 中 , 当 类 间 的 方差 达到 最 大 时 ,认为 目标 与 背景 的 错 分 概率 最 小 ,因为 方差 是 
灰 度 分 布 均匀 性 的 一 种 度量 ,方差 越 大 说 明 构 成 图 像 的 两 部 分 差异 就 越 大 。Otsu 方法 的 优点 
是 计算 简单 效果 稳定 ,不 管 直 方 图 有 无 明显 双 峰 都 能 得 到 较 满 意 的 分 割 结果 ,缺点 是 要 求 图 
像 中 目标 与 背景 的 面积 相近 。 

6.2.3” 灰 度 辣 值 法 的 实现 

本 节 将 结合 上 述 的 理论 给 出 具体 的 实现 方法 ,包括 Matlab 的 仿真 实现 以 及 基于 C 语言 
DM642 代码 ,以 便 读者 深入 了 解 灰 度 国 值 法 的 基本 概念 及 其 特点 ,掌握 其 实现 方法 。 

1. Matlab 实现 

(1) 灰 度 国 值 法 的 仿真 及 结果 
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(DM 文件 
A =imread( 'G ; \Fig. bmp') ; 
[ height, width | = size( A) ; 
B = zeros( height , width ) ; 
B = uint8( B) ; 
uint8 t; 
uint8 T; 
uint8 Gmax; 
uint8 Gmin; 
tz0; 
T 30; 
Gmax =0; 
Gmin =255; 
uint8 flag; 
flag=1; 
double ForegroundNum; 
double BackgroundNum ; 
double ForegroundSum ; 
double BackgroundSum; 
double ForegroundMean ; 
double BackgroundMean ; 
for i = 1 : height 
for j = 1: width 
temp = A(1,j) ; 
if temp < Gmin 
Gmin = temp; 
end 
if temp > Gmax; 
Gmax = temp; 
end 
end 
end 
T = ( Gmax + Gmin)/2; 


while( flag) 
ForegroundNum =0; 
BackgroundNum =0; 
ForegroundSum =0; 
= 20a 
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BackgroundSum =0; 
for i =1:height 
for j = 1:width 
temp = A(i,j) ; 
if temp >T 
ForegroundNum = ForegroundNum + 1; 
ForegroundSum = ForegroundSum + double( temp) ; 
else 
BackgroundNum = BackgroundNum - 1 ; 
BackgroundSum = BackgroundSum + double ( temp) ; 
end 
end 
end 
ForegroundMean = ForegroundSum/ForegroundNum ; 
BackgroundMean = BackgroundSum/ BackgroundNum ; 
t = uint8( ( ForegroundMean + BackgroundMean ) 72) ; 


iTS st 
flag =0; 
else 
Tt 
end 


end 
for i = 1 : height 
for j =1 ;width 


if A(i,j) «T 
B(i,j) 20; 
else 
B(i,j) 2255; 
end 
end 
end 
figure(1) ; 


imshow( A); 
title(' 原始 图 像 ) ; 
figure(2) ; 
imshow( B) ; 
title(' 靖 值 分 割 后 的 图 像 ') ; 
@) 仿 真 结果 
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灰 度 靖 值 法 仿真 结果 如 图 6-1 所 示 





b) 灰 度 阔 值 法 处 理 后 图 像 
图 6-1 灰 度 阔 值 法 仿真 结果 

(2 ) 最 大 方差 国 值 的 仿真 及 结果 

(DM 文件 


A = imread( 'G ; VFig. bmp! ); 


a) 原始 图 像 


| height , width ] = size( A) ; 
uint8 T; 
uint8 deep; 
double Rmax ; 
double wo; 
double wi; 
double uo; 
double ui; 
deep 7 256; 
Rmax 20; 
T 20; 
B = zeros( height , width ) ; 
B - uint8( B) ; 
P = zeros(] ,deep ) ; 
P = double( P) ; 
F zzeros(1, deep) ; 
F = double( F) ; 
for i = 1:height 

for j = 1 :width 

temp =A(i,]) +l; 
F(temp) =F(temp) +1; 

end 

end 
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for i = 1 ;deep 
P(i) =F(i)/( height * width) ; 
end 
for t = 1:deep 
wo =0; 
wi 20; 
uo 20; 
ui 20; 
forizl:t 
wo 2 wo 4 P(i); 
if wo >0 
uo 2uo +i * P(i)/wo; 
end 
end 
for i =t:deep 
wi 2 wi * P(i); 
if wi »0 
ui 2 ui +i * P(i)/wi; 
end 
end 


R-2wo*wi*(ui-uo) *(ui uo); 
if R > Rmax 
Rmax =R; 
T =t; 
end 
end 
for i = 1 ; height 
for j = 1:width 
it AC) <T 
B(i,j) 20; 
else 
B(1;]) 2255: 
end 
end 
end 
figure(1); 
imshow( A); 
title(' 原始 图 像 ') ; 
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figure(2) ; 


imshow( B); 
title(' BIET URBS AR '); 
2 仿真 结果 (图 6-2) 





a) 最 大 方差 闹 值 原始 图 像 b) 最 大 方差 阐 值 处 理 后 图 像 
图 6-2 ”最 大 方差 闪 值 法 仿真 结果 
2. 基 于 DM642 系统 的 实验 
这 里 基于 TMS320DM642 DSP 平台 给 出 灰 度 装 值 分 割 算 法 的 C 语言 实现 
(1) 灰 度 阔 值 法 的 仿真 及 结果 
Df; 3E 
仿真 设置 如 图 6-3 所 示 


à image Properties £8 image 


a) 原始 图 像 查看 设置 b) 灰 度 阔 值 分 割 后 图 像 查看 设置 
图 6-3 CCS 设置 

C)DM642 程序 

#include < stdio. h > 

&include < stdlib. h > 

#include < math. h > 

#define Width 512 

#define Height 350 

#define Deep 256 
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void ReadImage(char * cFileName ) ; 
void bmpDataPart( FILE * fpbmp) ; 
void iteration( ) ; 
spragma DATA, SECTION( input, "'. my. sect") 
#pragma DATA, SECTION( output, "". my, sect") 
unsigned char input[ Height | [ Width | ; 
unsigned char output[ Height | [ Width ] ; 
void main( ) 
| 
/* EE n 
ReadImage( "'G ; \cargray512. bmp) ; 
iteration( ) ; 
while (1); 
| 
void ReadImage( char * cFileName) 
| 
FILE *fp; 
if ( fp =fopen(cFileName, "rb"') ) 
| 
bmpDataPart( fp) ; 
fclose( fp) ; 


| 
void bmpDataPart( FILE * fpbmp) 
| 
int 1, j =0; 
unsigned char * pix = NULL; 
fseek (fpbmp, 1078L, SEEK SET) ; 
pix = (unsigned char * ) malloc ( Width) ; 
for(j 20;j < Height;j + +) 
| 


fread( pix, 1, Width , fpbmp) ; 
for(120;i < Width;i + + ) 
| 
input[ Height -1 ~-j][i] =pix[i]; 
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void iteration( ) 


| 


int i,j; 

unsigned char T ,t; 
unsigned char Gmax; 
unsigned char Gmin; 
unsigned char flag; 
unsigned char temp; 
double ForegroundNum; 
double BackgroundNum ; 
double ForegroundSum ; 
double BackgroundSum; 
double ForegroundMean ; 
double BackgroundMean ; 


t=0; 
T=0; 
Gmax =0; 
Gmin =255; 
flag=1; 


for(i =0;i < Height;i + +) 
| 
for( j 20;j < Width;j + +) 
| 
temp 7 input [i] [j]; 
if( temp < Gmin) 


Gmin = temp; 
if( temp » Gmax ) 


Gmax = temp; 





| 
T = ( Gmin + Gmax )/2; 
while( flag) 
| 
ForegroundNum =0; 
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BackgroundNum =0; 
ForegroundSum -0; 
BackgroundSum =0; 
for(i =0;i «Height;i + + ) 
| 
for(j =0;j<Width;j+ +) 
| 
temp 2 input[ i] | j] ; 
if(temp » T) 


ForegroundNum = ForegroundNum + 1 ; 


ForegroundSum = ForegroundSum + ( double) temp; 


else 


BackgroundNum = BackgroundNum 4 1; 
BackgroundSum = BackgroundSum + ( double) temp; 


| 

ForegroundMean = ForegroundSum/ ForegroundNum ; 
BackgroundMean = BackgroundSum/ BackgroundNum ; 

t = (unsigned char) ( ( ForegroundMean + BackgroundMean ) 72) ; 
it s= T) 


flag 20; 





| 
Í 


for(i =0;i < Height;i + +) 
| 
for(j =0;j<Width;j+ +) 
| 
temp = input[ i][j] ; 
if(temp « T) 
一 200 一 
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output[ i][j] 20; 


else 


| 


output[ i][j] 2255; 





| 


QU; RR 
仿真 结果 如 图 6-4 所 示 。 


CS Debug - herstiorymane « Code Composer Studio 





图 6-4 仿真 结果 


(2 ) 最 大 方差 国 值 法 
QD 程序 代码 
#include < stdio. h > 
#include < stdlib. h > 
#include < math. h > 
#define Width 512 
#define Height 350 
#define Deep 256 
void ReadImage( char * cFileName) ; 
void bmpDataPart( FILE *  fpbmp) ; 
void maxvariance( ) ; 
spragma DATA, SECTION( input , "'. my, sect") 
#pragma DATA, SECTION( output , ". my. sect") 
fpragma DATA, SECTION( p, "". my, sect" 
unsigned char input[ Height | [ Width ] ; 
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unsigned char output| Height | | Width | ; 
double p[ Deep] ; 
void main( ) 
| 
/* 图 像 */ 
ReadImage( "'G: Vcargray512. bmp) ; 
maxvariance( ) ; 
while (1) ; 
| 
void ReadImage(char * cFileName ) 
| 
FILE * fp; 
if ( fp = fopen( cFileName , rb" ) ) 
| 
bmpDataPart( fp) ; 
fclose( fp) ; 


| 
void bmpDataPart( FILE * fpbmp) 
| 
ini 1, ] «0; 
unsigned char * pix = NULL; 
fseek( fpbmp, 1078L, SEEK, SET) ; 
pix = (unsigned char * ) malloc( Width) ; 
for(j 20;j «Height;j + + ) 
| 
fread(pix, 1, Width , fpbmp) ; 
for(i =0;i <Width;i + +) 
| 
input[ Height -1 -j][i] | -pix[i]; 
| 


| 


void maxvariance( ) 


| 
int t; 
int T; 


int 1,j; 


$635 [E 


s=% = 
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double N; 

double R; 

double Rmax ; 
double wo ,uo; 
double wi , ui ; 
unsigned char temp; 
T a05 

R 20; 

Rmax 20; 

N = Height * Width; 
for(i =0;i < Deep;i + +) 


pli] =0; 


for(i =0;i < Height;i + + ) 





for(j 20;j < Width;j + +) 
| 

temp =input[i][j]; 

pl temp] 2 p temp] +1; 


l 


for(i =0;i < Deep;i+ +) 


for(t =0;t < Deep;t+ +) 
! 


1 


wo 20; 
uo 20; 
wi 20; 
ui 20; 


for(120;i1«t;i* +) 
| 
wo =wo +plil]; 
uo =uo +i * pli]j/wo; 
| 
for(i =t;i < Deep;i + +) 
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wi=wi+pli]; 
ui =ui +i * p[i]/wi; 
| 
R =wo * wi * (ui -uo) * (ui -uo) ; 
if(R > Rmax) 
| 
Rmax =R; 
T zt; 


Per m +) 
| for( j =0;j < Width;j + +) 
| output | i][j] =input[i][j]; 
if(output[ i][j] < T) 
| output[ i] [j] 20; 
| 


else 


| 
| 


output[ i] [j] 2255; 





a) RAJ 25 BUE 4 R P ”tb) 最 大 方差 阔 值 分 割 后 图 像 
图 6-5 最 大 方差 阐 值 法 仿真 结果 
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6.3 边缘 检测 


边缘 是 图 象 最 基本 的 特征 ,常常 意味 着 一 个 区 域 的 终结 和 另 一 个 区 域 的 开始 ,对 图 像 识别 
和 计算 机 分 析 十 分 有 用 。 边 缘 能 勾画 出 目标 物体 ,使 观察 者 一 目 了 然 ,蕴含 了 丰富 的 内 在 信息 
(如 方向 、 阶 跃 性 质 、 形 状 等 ) ,是 图 像 识 别 中 抽取 图 像 特征 的 重要 属性 。 

所 谓 边缘 是 指 其 周围 像素 灰 度 发 生 阶 跃 变化 或 屋顶 状 变化 的 那些 像素 的 集合 , 它 存在 于 
目标 与 背景 、 目 标 与 目标 .区域 与 区 域 , 基 元 与 基 元 之 间 ,是 图 像 局 部 特征 不 连续 的 结果 。 在 数 
学 上 可 利用 灰 度 的 导数 来 刻画 边缘 点 的 变化 ,因此 常用 一 阶 和 二 阶 导数 来 检测 边缘 。 下 面 来 
看 一 下 3 种 常见 的 边缘 剖面 :阶梯 状 如 图 6-6a) 所 示 ;@ 脉 冲 状 如 图 6-6b) 所 示 ;图 屋顶 状 如 
图 6-6c) 所 示 。 阶 梯 状 的 边缘 处 于 图 像 中 2 个 具有 不 同 灰 度 值 的 相 邻 区 域 之 间 , 主要 对 应 细 
条 状 的 灰 度 值 突 变 区 域 ,二 阶 方向 导数 在 边缘 处 呈 零 交叉 脉冲 状 ,而 屋顶 状 的 边缘 上 升 下 降 都 
比较 缓慢 ,二 阶 方向 导数 在 边缘 处 取 极 值 。 由 于 采样 的 缘故 ,数字 图 像 中 的 边缘 总 有 一 些 模 
糊 , 所 以 这 里 垂直 上 下 的 边缘 剖面 都 表示 成 有 一 定 坡度 。 

边缘 的 特性 是 沿边 缘 走 向 的 像素 变化 平 
缓 ,而 垂直 于 边缘 方向 的 像素 变化 剧烈 。 所 以 ， 
边缘 检测 的 实质 是 采用 某 种 算法 来 提取 出 图 像 


中 灰 度 发 生 急剧 变化 的 的 区 域 边界 ,首先 检 出 

id 2g ze "b E E 
e 
zn -y- M23 





边缘 像素 连 成 完备 的 边界 。 从 这 个 意义 上 说 ， 
边缘 检测 方法 就 是 对 原始 图 像 中 像素 的 某 小 邻 
域 来 构造 边缘 检测 算 子 。 这 里 对 几 种 经 典 的 边 
缘 检 测算 子 进行 理论 分 析 , 并 对 各 自 的 性 能 特 
图 6-6 边缘 和 导数 RTEHSERT UE, 

6.3.1 梯度 算 子 

图 像 边 缘 为 两 个 强度 明显 不 同 区 域 之 间 的 过 渡 , 导 数 算 子 具 有 突出 灰 度 变化 的 作用 ,对 图 
像 运 用 导数 算 子 ,图 像 梯度 在 这 些 过 渡 边 界 上 将 存在 最 大 值 ,因此 可 将 这 些 梯度 值 作为 相应 点 
的 边界 强度 ,通过 设置 门限 的 方法 ,提取 边界 点 集 。 

梯度 对 应 一 阶 导 数 , 对 于 一 个 连续 图 像 函 数 f(x,y) , 它 在 点 f(x,y) 处 的 梯度 值 是 一 个 失 
量 , 定 义 为 


Vf(x,y)s[G, G,]'s E ¥| (6-13) 

式 中 ,G, 和 G, 分 别 为 沿 * 方向 和 y 方 向 的 梯度 。 梯 度 的 幅度 和 方向 角 分 别 为 
IV Gr») | =mag( Vf x,3)) 2 [6 4 6:17 (6-14) 
(x,y) = aretan( G,/6, ) (6-15) 


由 式 (6-14) 可 知 ,梯度 的 数值 就 是 f(x,y) 在 其 最 大 变化 率 方向 上 的 单位 距离 所 增加 的 
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量 。 对 于 数字 图 像 而 言 ,梯度 是 由 差分 代替 微分 来 实现 的 , 式 (6-14) 可 以 写作 
|vKxsy)|={1LRxsy) -Kax +1,y)]? € UG) -fx,y +1) 1 (6-16) 
为 了 简化 运算 ,降低 处 理 的 工作 量 ,通常 在 实际 应 用 中 将 式 (6-16 ) 的 梯度 幅 值 简化 为 
[vACx,7) | = Isxsy) -flx 1,2 E UG) -Axy +1) | (6-17) 
式 中 各 像素 的 位 置 如 图 6-7a) 所 示 , 这 种 梯度 法 又 称 为 水 平 垂直 差分 法 。 另 一 种 梯度 法 
如 图 6-7b) 所 示 ,是 交叉 地 进行 差分 计算 , 称 为 Robert 梯度 算法 ,表示 为 
IvfGs») | 8 LUfGu») -Kx+ly+l)]2+[Kx+ly) -f(x,y +1)]?} (6-18) 
同样 可 以 近似 为 
[VAGx,y) |= |fCx,y) -Kxz+ly+l)|+|Kxz+ly) -f(x,y+1)| (6-19) 


eo 


fo, y+1) 
2) 水 平 垂直 差分 法 b) Robert 梯 度 法 
图 6-7 求 梯度 的 两 种 差分 方法 
在 实际 中 常用 小 区 域 模板 卷 积 来 近似 计算 偏 导数 ,对 C, 和 C, 各 用 一 个 模板 ,所 以 需要 2 
个 模板 组 合 起 来 以 构成 1 个 梯度 算 子 。 如 图 6-8 所 示 , 其 中 ,图 6-8a) 为 Robert 算 子 ,图 6-8b) 
为 Prewitt 算 子 ,图 6-8c) 为 Sobel 算 子 。 


fo, y) fo y+) 











在 实际 图 像 中 ,对 应 景象 边缘 的 图 像 灰 度 变 化 有 
时 并 不 十 分 陡 霄 ,同时 ,图 像 中 也 存在 噪声 ,因此 直接 | "| | [i v] 
运用 微分 算 子 提取 边界 后 ,边界 往往 表现 为 不 连续 或 [51 "| p» [3] 


含有 假 边缘 ,还 需 做 某 些 处 理 ( 如 连接 及 细 化 等 ) 才 能 
形成 有 意义 的 边界 。 

6.3.2 拉 普 拉 斯 算 子 

在 阶 路 边缘 处 灰 度 的 变化 速率 最 大 , 如 图 6-8a) 
所 示 ,边缘 点 对 应 的 二 阶 导 数 为 过 零点 。 拉 普 拉 斯 算 
子 也 是 常用 的 边缘 检测 算 子 , 它 是 各 向 同性 的 二 阶 导 
数 , 具 有 旋转 不 变性 ,对 灰 度 突变 敏感 。 

vf.) = (6-20) 


经 边缘 检测 后 的 图 像 g(x,y) 为 c) Sobel 算 子 
g(x,y) =f(x,y) -kv'f(x,y) — (621) Kies JURMMOHIDBUETRET 
式 中 ,系数 上 与 扩散 效应 有 关 。 图 像 f(x,y) 经 拉 
普 拉 斯 运算 后 得 到 检测 出 边缘 的 图 像 g(x,y) 。 需 要 注意 的 是 ,对 系数 上 的 选择 要 合理 , 太 大 
会 使 图 像 中 轮廓 边缘 产生 过 冲 , 太 小 则 边缘 不 明显 。 。 
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对 数字 图 像 来 讲 ,Kx,y) 的 二 阶 偏 导数 同样 可 以 用 差分 近似 微分 来 表示 
PÁG ML [Ka+ly) - fiy) - UG) -Kx 17)] 
=f(x +1,y) +f(x -1,y) -2f(x,y) (6-22) 


fry +1) für 1) -2fGoy) 


对 此 拉 普 拉 斯 算 子 V f(x y) A 


^ 9* 
vfu) 212424. 
x ðy 


sfa +1,y) «f(x Muy) fice D efGoy- 1) -4fGsy) 
= SG) UG a) eG m1) &fGsr1) fay) G1] 


(6-23) 


可 见 数字 图 像 在 (x,y) 点 的 拉 普 拉 斯 边缘 检测 值 ,可 由 (x,y) 点 的 灰 度 值 减 去 该 点 邻 域 的 
平均 灰 度 值 来 求 得 。 
对 阶 路 状 边缘 ,二 阶 导数 在 边缘 点 处 产生 一 个 陡峭 的 过 零点 , 即 边缘 点 两 边 二 阶 导数 取 异 
E, Laplace 算 子 就 是 据 此 对 f(x,y) 的 每 个 像素 取 它 关于 x 方向 和 y 方 向 的 二 阶 差分 之 和 ,这 
是 一 个 与 边缘 方向 无 关 的 边缘 检测 算 子 。 而 对 屋顶 状 边缘 ,在 边缘 点 的 二 
[* | 1| * | 阶 导数 取 极 小 值 ,这 时 对 /(x，y) 每 个 像素 取 它 关于 x 方 向 和 了 方向 的 一 
prj | 1 | 阶 差分 之 和 的 相反 数 。 
|。| 1 | 。| 另外 , 式 (6-23) 还 可 以 表示 成 模板 的 形式 ,如 图 6.9 所 示 。 从 模板 形式 
xe» many 可 以 看 出 , 拉 普 拉 斯 算 子 具 有 各 向 同性 和 旋转 不 变性 。 如 果 在 图 像 中 的 一 
运算 模板 “个 较 瞳 的 区 域 中 出 现 了 一 个 亮点 ,那么 用 拉 普 拉 斯 运算 就 会 使 这 个 亮点 变 
得 更 亮 。 因 为 在 图 像 中 的 边缘 就 是 那些 灰 度 发 生 跳 变 的 区 域 ,所 以 拉 普 拉 斯 算 子 在 边缘 检测 
中 很 有 用 。 但 是 , 拉 普 拉 斯 算 子 也 存在 一 些 缺 点 :一 是 边缘 方向 信息 易 丢失 ;二 是 算 子 为 二 阶 
微分 算 子 ,与 一 阶 微分 比较 对 噪声 更 敏感 , 双 倍加 强 了 图 像 中 噪声 的 影响 。 
在 实际 应 用 中 , 拉 普 拉 斯 算 子 进行 边缘 检测 之 前 ,为 去 除 噪 声 的 影响 ,首先 要 用 高 斯 函数 
对 图 像 进行 滤波 , 称 为 拉 普 拉 斯 高 斯 算 子 法 。 


6.3.3 Canny 算 子 


1986 年 ,Canny 定义 了 边缘 检测 算 子 的 三 条 评价 准则 ,并 提出 了 一 种 基于 最 优化 算法 的 边 
缘 检 测算 子 。Canny 算 子 被 认为 是 目前 使 用 最 广泛 的 边缘 检测 方法 之 一 ,具有 很 好 的 信 噪 比 
和 检测 精度 。Canny 算 子 首先 用 高 斯 平滑 滤波 来 抑制 图 像 中 的 噪声 ,通过 一 阶 差分 算 子 计算 
图 像 梯度 幅 值 的 方向 。 然 后 对 梯度 幅 值 进行 非 极 大 值 抑制 ,最 后 通过 双 冰 值 方法 来 提取 边缘 。 
一 个 边缘 算 子 必须 满足 以 下 三 个 准则 。 

(1) 低 错误 率 :边缘 算 子 应 该 只 对 边缘 响应 ,不 漏 检 真 实 边缘 ,也 不 把 非 边 缘 点 作为 边缘 
点 检 出 ,使 输出 的 信 噪 比 最 大 。 
一 2 
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(2) 定 位 精度 ;被 边缘 算 子 找到 的 边缘 像素 与 真正 的 边缘 像素 间 的 距离 应 尽 可 能 地 小 。 

(3) 单 边 响 应 :对 于 单个 边缘 点 仅 有 一 个 响应 。 

以 上 就 是 边缘 检测 的 三 个 准则 ,从 理论 上 建立 了 最 优 边缘 检测 的 理论 基础 ,将 边缘 检测 优 
劣 评价 的 三 个 准则 表达 出 来 ,将 寻找 给 定 条 件 下 的 最 优 算 子 工作 转化 为 一 个 泛 函 最 优 
问题 。 

在 Canny 的 假设 下 ,对 于 一 个 带 有 高 斯 白 噪 声 的 阶 跃 边缘 ,边缘 检测 算 子 是 一 个 与 图 像 函 
数 g(x,y) 进行 卷 积 的 滤波 器 f, 这 个 卷 积 滤波 右 应 该 平滑 掉 日 噪声 并 找到 边缘 人 位置。 问题 是 
怎样 确定 一 个 能 够 使 三 个 准则 都 得 到 优化 的 滤波 器 函数 。 

根据 第 一 个 准则 ,滤波 器 函数 ,对 边缘 G 的 响应 由 下 面 的 卷 积 积分 给 出 : 


B f e -ay x) da (6-24) 
假设 区 域 [ -=w,w] 外 函数 8 的 值 为 0, 则 数学 上 三 个 准则 的 表达 式 为 
[ecw 


|| Pad 


ff eC- a) 


wA |] Pow 


1/2 


SNR (6-25) 





Localization = 


(6-26) 


| Pc 


3 (6-27) 
A| Kxz)dx 


Xzc 三 TT 








信 噪 比 SNR 是 输出 信号 与 噪声 的 比值 ,由 信号 检测 理论 可 知 , 它 的 值 越 大 说 明 信 和 号 越 强 ; 
Localization 是 检测 到 的 边缘 到 真正 边缘 距离 的 倒数 ,这 个 值 越 大 说 明 所 检测 的 边缘 与 真正 边 
缘 的 距离 越 小 ,二 者 越 接 近 ;xzx 是 一 个 约束 条 件 , 它 代表 几 零 交叉 点 间 的 平均 距离 ,说明 滤波 
器 8 在 小 区 域内 对 同一 个 边 不 会 有 太 多 的 影响 。Canny 把 上 面 三 个 公式 结合 起 来 SNR * Local- 
ization/xzc ,并 试图 找到 能 使 之 最 大 化 的 滤波 器 ,但 结果 太 复 杂 , 最 后 Canny 证 明了 该 优化 的 边 
缘 检测 滤波 器 可 以 由 高 斯 函数 的 一 阶 导数 去 最 佳 的 逼 近 , 并 且 使 用 高 斯 函数 的 一 阶 导数 计算 
使 问题 变 得 简单 化 。 

Gaussian 卷 积 得 到 的 边缘 图 像 中 还 存在 一 些 较 高 梯度 值 的 、 非 边缘 的 点 ,这 对 真正 的 边缘 
是 一 种 干扰 ,为 了 精确 定位 边缘 ,必须 细 化 梯度 幅 值 图 像 中 的 屋 疹 带 , 只 保留 幅 值 局 部 变化 最 
大 的 点 ,这 一 过 程 就 是 非 极 大 值 抑制 。 对 于 一 个 边缘 像素 ,都 会 有 一 个 与 该 点 所 在 的 边 垂直 的 
梯度 方向 ,并且 该 像素 的 梯度 值 要 大 于 该 边 两 侧 的 像素 的 梯度 值 。Canny 根据 这 种 思想 用 抑 
制 非 极 大 值 点 的 算法 对 梯度 图 像 做 了 后 续 处 理 , 非 极 大 值 抑制 通过 抑制 梯度 方向 上 的 所 有 非 
屋 疹 峰值 的 梯度 幅 值 得 到 细 化 边缘 。 
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图 像 梯度 幅 值 矩 阵 中 的 元 素 值 越 大 ,说 明 图 像 中 该 点 的 梯度 值 
越 大 ,但 这 不 能 说 明 该 点 就 是 边缘 (这 仅仅 是 属于 图 像 增 强 的 过 
程 ) 。 在 Canny 算法 中 , 非 极 大 值 抑制 是 进行 边缘 检测 的 重要 步骤 。 

根据 图 6-10 可 知 ,要 进行 非 极 大 值 抑制 ,就 首先 要 确定 像素 点 
C 的 灰 度 值 在 以 其 为 中 心 的 8 值 邻 域内 是 否 为 最 大 。 图 6-10 中 红 
色 的 线条 方向 为 C 点 的 梯度 方向 ,因为 根据 梯度 定义 在 梯度 方向 上 
存在 梯度 最 大 值 ,那么 可 以 确定 其 局 部 的 最 大 值 肯定 分 布 在 这 条 线 
上 ,也 即 除 了 C 点 外 ,梯度 方向 的 交点 dTmpl 和 dTmp2 这 两 个 点 的 

Meio 下 二 值 也 可 能 会 是 局 部 最 大 值 。 因 此 ,C 点 灰 度 与 这 两 个 点 灰 度 大 小 即 

可 判断 C 点 是 否 为 其 邻 域 内 的 局 部 最 大 灰 度 点 。 如 果 经 过 判断 ,C 点 灰 度 值 不 比 梯度 方向 的 
两 个 相 邻 点 的 梯度 幅 值 大 , 那 就 说 明 C. 点 不 是 局 部 极 大 值 ,标记 为 非 边缘 点 并 将 其 赋值 为 零 。 
知 在 梯度 方向 C. 点 灰 度 值 最 大 , 则 将 其 标记 为 候选 边缘 点 , 且 灰 度 值 保持 不 变 。 这 就 是 非 极 
大 值 抑制 的 工作 原理 。 

此 外 ,为 了 减少 假 边 缘 ,Canny 算 子 对 非 极 大 值 抑制 后 的 幅 值 图 阵列 进行 阔 值 化 , 称 之 为 
双 国 值 法 , 即 选择 两 个 靖 值 7, 和 也 LT, PROS SIL, T, WRR, T, 是 由 求 幅 值 图 像 的 累计 
直方 图 得 到 的 高 国 值 , 且 T, 20. 4T,. SISTERE. T, 得 到 一 个 边缘 图 像 ,认为 该 图 像 为 真实 的 
边缘 图 像 含有 很 少 的 假 边缘 ,但 是 由 于 阔 值 较 高 ,产生 的 图 像 边 缘 可 能 不 闭合 ,为 解决 这 样 一 
个 问题 采用 了 另外 一 个 低 国 值 。 在 高 浆 值 图 像 中 把 边缘 连接 成 轮廓 , 当 到 达 轮 廓 的 端点 时 ,该 
算法 会 在 断 点 8 的 邻 域 点 中 寻找 满足 低 立 值 的 点 ,再 根据 此 点 收集 新 的 边缘 进行 连接 ,直到 整 
个 图 像 边缘 闭合 。 

6.3.4 边缘 检测 算法 的 实现 

1. Matlab 仿真 

下 面 是 几 种 边缘 检测 算 子 的 Matlab 实现 。 为 使 代码 简洁 ,本 代码 的 测试 图 片 选择 灰 度 
图 像 。 

(OM 文件 代码 

I = imread ( 'D ; \Administrator \My Pictures\Lenagray. bmp!) ; 

BW_sobel = edge(I, 'sobel') ; 

BW. prewitt = edge( I, 'prewitt') ; 

BW roberts = edge([,'roberts') ; 





BW. canny = edge(I'canny'); 
figure(1) ; 
subplot(2 ,3 ,1 ) ,imshow( I) ,xlabel( ' 原始 图 像 '); 
subplot(2 ,3 ,2 ) ,imshow( BW. sobel) ,xlabel( 'sobel 检测 ') ; 
subplot(2 ,3 ,3 ) ,imshow(BW_prewitt) ,xlabel( 'prewitt 检测 ') ; 
subplot(2 ,3 ,4) , imshow( BW. roberts) ) ,xlabel( 'roberts 检测 ') ; 
subplot(2 ,3 ,5) ,imshow(BW_canny) ,xlabel( 'canny 检测 ') ; 
@) 仿 真 结 果 ( 图 6-11) 
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如 图 6-11 所 示 ,比较 图 6-11f) Canny 处 理 结果 与 其 他 几 个 算 子 进行 边缘 检测 的 结果 ,可 以 
看 出 Canny 算 子 检测 结果 不 单 能 清晰 地 提取 图 pen 缘 , 而 且 边 缘 连 续 性 比较 好 ,这 就 是 
Canny 算 子 的 优良 之 处 . 





a) 原 图 





d) Sobel 处 理 l e) 拉 普 拉 斯 处 理 f) Canny 4b fi 


图 6-11 几 种 边缘 检测 算 子 处 理 比较 


2. 基 于 DM642 系统 的 程序 实现 

这 里 基于 TMS320DM642 DSP 平台 给 出 边缘 检测 算法 的 C 语言 实现 ,算法 流程 图 如 图 6-12 

所 示 。 

(D 流 程 图 (图 6-12) 

Q@DM642 程序 源 代码 

a. 梯度 算 子 和 拉 普 拉 斯 算 子 

#include < stdio. h > 

#include < stdlib. h > 

#include < math. h > 

#define IMAGEWIDTH 256 

#define IMAGEHEIGHT 256 

#define Uint8 unsigned char 

#pragma DATA. SECTION( greyout, V my. sect" ) 
void ReadImage( char * cFileName) ; 


void bmpDataPart( FILE * fpbmp) ; 
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相关 变量 定义 
读 取 待 处 理 图 像 


Robert Prewitt Sobel 拉 普 拉 斯 
"T «T HF "T 


处 理 后 图 像 显 示 






a) 程序 (1) 流 程 图 
图 6-12 程序 流程 图 


void EdgeDetection( ) ; 


unsigned char grey[ IMAGEHEIGHT | [ IMAGEWIDTH | ; 
unsigned char greyout| IMAGEHEIGHT | | IMAGEWIDTH | ; 


void main( ) 


| 
/* EE */ 









相关 变量 定义 
读 取 待 处 理 图 像 


GaussSmooth() 
函数 卷 积 


Grad0 函 数 求 
取 纵横 梯度 


NonmaxSuppress() 


非 极 大 值 抑制 







处 理 后 图 像 显 示 





b) 程序 (2) 流 程 图 


ReadImage ( "D ; VAdministrator My Pictures\Lenagray. bmp" ) ; 


EdgeDetection( ) ; 
while (1) ; 

| 

void ReadImage( char * cFileName) 

| 
FILE *fp; 
if ( fp =fopen(cFileName, rb") ) 
| 

20 一 


bmpDataPart( fp) ; 
fclose( fp) ; 


| 
void bmpDataPart( FILE * fpbmp) 
| 
int i, j 20; 
unsigned char * pix = NULL; 
fseek(fpbmp, 1078L, SEEK SET) ; 
pix = (unsigned char * ) malloc(256) ; 
for(j 20;j «IMAGEHEIGHT;j + +) 
| 
fread( pix, 1, 256, fpbmp) ; 
for(i =0;i < IMAGEWIDTH;i-* +) 


| 
1 


perl IMAGEHEIGHT 1 -11[i] =pli]; 
greyout[ IMAGEHEIGHT -1 -j] [i]  -pix[i]; 


f 


| 
/* 
边缘 检测 
1. 梯度 算 子 (Robert 算 子 、Prewitt 算 子 Sobel 算 子 ) 
2. 拉 普 拉 斯 算 子 
*/ 
void EdgeDetection( int choose ) 
| 
int i,j; 


int greytemp. x,greytemp. y; 
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// int Kx(2][2] 2111,0],10, 211 |; // Robert 算 子 

// in Ky[2][2] 2110,11,1 21,0] | ; 

/l aor oc e Ie M uai // Prewitt 算 子 
// int Ky[3][3] 2111,1,1/,10,0,0] , | - 1, 11; 

/l Lu tel ue A // Sobel 算 子 
A à4daESI3)31I8s1112;11,10,0;0] 1 -1, -2; -11H 1a 

int K[3][3] = 110,1,0] , 11, 24,1], 10,1,0] ] ; // 拉 普 拉 斯 算 子 


for(i=1;i<IMAGEHEIGHT -1;i + +) 
| 
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for(j 21;j «IMAGEWIDTH -1;j * +) 
| 
// 测试 Robert 算 子 /Prewitt 算 子 /Sobel 算 子 
/* greytemp x = ( 
[0] *grey[i-1][j-1] 4 
[1] *grey[i-1][j] + 
[2] *grey[i-1][j +I] + 
]*eeyLi]lje1] + 
[1] * grey i][j] * 
2] *greyli][j+1] + 
Kx[2][0] *grey[ i*1][j-71] * 
]L[1] *grey[i11[j] 
[2][2] *gey[ i *1][j 1] 




















greytemp y = ( 


Ky[2][0] *gey[ i *1][j-1] + 
Ky[2][1] *gey[i*1][j] + 
Ky[2][2] * gey[ i 1] [j *1] 
)i *7 
/ * 测试 Robert 算 子 
greytemp x = ( 
Kx[0][0] *grey[i][j] + 
Kx[0][1] *grey[il[j *1] + 
Kx[1][0] *grey[i*1][j] + 
Kx[1][1] * grey i c1] [j € 1] 
3 
greytemp y = 








[j] * 
[j*1] + 


0] * grey[ i) 
* grey[ i) 
*gry[i*1][j] + 
grey[i+1][j+1] 


* 
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*/ 
// 测 试 拉 普 拉 斯 算 子 
/* */ greytempx = ( 
K[0] 10] wgrey[i-1][]-1] + 
K[0][1] *grey[i-1][j] + 
K[0][2] *gey[i-1][j*1] + 
K[1][0] *gey[i][j-1] + 
K[1][1] * geey[ i] [j] + 
K[1][2] *gey[i][j*1] + 
K[2][0] *gey[i*1][j-71] + 
K[2][1] *grey[i+1][j] + 
K[2][2] *grey[i*1][j *1] 
Ja 


if( greytemp x « 0) 
greytemp x -0; 
if( greytemp. x > 255) 
greytemp. x 2255; 
greyout[ i][j] = greytemp. x; 
//greyout[i][j] 2 sqrt( greytemp. x * greytemp. x + greytemp. y * greytemp. y) ; 


| 

b. Canny 算 子 

#include < stdio. h > 

stinclude < stdlib. h > 

#include < math. h > 

#define IMAGEWIDTH 256 

#define IMAGEHEIGHT 256 

#define Uint8 unsigned char 

#pragma DATA, SECTION( outgrey ," . my, sect" ) 
*pragma DATA, SECTION ( Gx," . my, sect" ) 
spragma DATA, SECTION( Gy," . my, sect" ) 
void ReadImage( char * cFileName ) ; 

void bmpDataPart( FILE * fpbmp ) ; 

void GaussSmooth( ) ; 

void Grad( ) ; 

void NonmaxSuppress( ) ; 

void trace( int low , int x , int y); 
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void Canny( ) ; 
unsigned char grey[ IMAGEHEIGHT | ( IMAGEWIDTH | ; 
unsigned char outgrey| IMAGEHEIGHT ] [IMAGEWIDTH | ; 
int Gx[256]1[256],Gy[256][256]; 
void main( ) 
| 
/* 图 像 */ 
ReadImage( " D; \ Administrator \My Pictures \Lenagray. bmp" ) ; 
Canny ( ); 
while (1); 


void ReadImage( char * cFileName) 
| 
FILE *fp; 
if ( fp 2 fopen( cFileName," rb" ) ) 
| 
bmpDataPart( fp) ; 
fclose( fp) ; 


void bmpDataPart( FILE * fpbmp) 
| 
int i, j 20; 
unsigned char * pix = NULL; 
fseek ( fpbmp, 1078L, SEEK SET) ; 
pix = (unsigned char * ) malloc(256) ; 
for(j 0;j «IMAGEHEIGHT;j + +) 
| 
fread( pix, 1, 256, fpbmp) ; 
for(i =0;i < IMAGEWIDTH ;i + +) 
| 
grey[ IMAGEHEIGHT -1 -j][i]  -pix[i]; 
outgrey[ IMAGEHEIGHT -1 -j][i] =pixli]; 


void Canny( ) 
| 
int high =0,low =0; // EXER [E 
int i,j, * nhist; 
double sum =0,v =0; 
// 第 一 利用 高 斯 滤波 器 对 图 像 卷 积 
GaussSmooth( ) ; 
// 第 二 求 纵横 梯度 图 
Grad( ) ; 
// 第 三 步 是 进行 非 极 大 抑制 
NonmaxSuppress( ) ; 
// 第 四 步 是 边缘 连接 
/A(1) 找 到 自 适 应 高 低 阀 值 ; 
nhist = (int * ) malloc( (400) * sizeof( int) ) ; 
for(i =1;i<400;i+ +) 
nhist[i] =0; 
for(i =0;i < IMAGEHEIGHT;i + +) 
for( j =0;j < IMAGEWIDTH;j + +) 
if( outgrey[ i][j] = =128) 
nhist[ grey[ i] [j]] + +; 
sum -0; 
for(121;1«400;i * +) 
sum + -nhist[i|; 
v 20; 
for(i =1;i <400;i+ +) 
| 
v+ -nhist[ i]; 
if( v > 20.70 * sum +0.5) 
| 
high zi; 
break ; 
| 
| 
low = (int) (0.4 * ( (float) high) +0.5); 
free( nhist ) ; 
// (2) —EA&T ERATIS CLR CES RA 
for(i =0;i < IMAGEHEIGHT;i + +) 
| 
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for(j =0;j < IMAGEWIDTH;j + +) 
| | 
if( (outgrey[ 1][j] = 2128) && (grey[ i]|j] > = high)) 
| 
outgrey[ i][j] = 255; 


trace( low ,i,j) ; 


por e 
for(i =0;i «IMAGEHEIGHT;i + +) 
T =0;j < IMAGEWIDTH;j + + ) 
| if(outgrey[ i][j] ! = 255) 
| ougrey[i][j] 20; /设置 为 非 边界 点 


| 
/* 平 滑 处 理 ( 高 斯 模板 ) * / 
void GaussSmooth( ) 
| 
int i,j; 
float temp; 
int greytemp ; 
for(i = 1;i < IMAGEHEIGHT -1;i+ +) 
| 
for(j 21;j <IMAGEWIDTH -1;j * +) 
| 
temp = ( gryi-1][j-1] + 2*geyli-1][j] + gey[i-1][j*1] + 
2*gey[i][j-1] + 4*geylillj] +2*grey[i][j+1] + 
geyli+1][j-1] + 2*geyli*1][j] + geyli*1][j *1]); 
greytemp = (int) (temp/16 + 0.5); 
if( greytemp <0) 
| 
greytemp = 0; 
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if( greytemp » 255) 


greytemp = 255; 





outgrey[i][j] = greytemp; 
| 
| 
| 
void Grad( ) 
| 
int i,j; 
int Kx[2][2] 21[1,0],10, -1]] ; // Robert 算 子 
int Ky[2][2] 2110,11], 1 -1,0]] ; 
for(i =1;i «IMAGEHEIGHT - 1;i * +) 
| 
for(j =1;j <IMAGEWIDTH -1;j + +) 
| 
/* 测试 Robert AF */ 
Gx[i]l[j] = ( 
Kx[0][0] *outgrey[i][ j] + 
Kx[0][1] *outgrey[ i][ j -1] + 
Kx[1][0] *outgrey[ 1-1][j] + 
Kx[1][1] 
)3 
Gy[i)J[j] = ( 
Ky[0] 
Ky[0] 
] 
1 


* outgrey[ i +1][j+1] 


[0] *outgrey[ i][j] + 

[1] *outgrey[ i][j 1] + 
[0] LELT * 
] 


* outgrey[ i - 1][j 1] 


Ky[1 
Ky[1][ 
)s 
gey[i][j] = sqrt(Gx[L i] [3] * GxLi] Lj] +Gy[i][j] * Gy [C3] L3) 5 
| 


* outgrey 


| 
| 
// 非 最 大 抑制 
void NonmaxSuppress( ) 
| 
= 到 /一 
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int gx , gy ,greytemp ; 
int compl , comp2 ; 
it T; fc 
double weight ; 
for(i =1;i «IMAGEHEIGHT -1;i * +) 
| 
for j 21;j «IMAGEWIDTH - 15j 4) 
| 
if(grey[i][j] = =0) 
| 
outgrey[ i] [j] =0; 
continue ; 
| 
else 
| 
gxz6x[i][jl s 
gy =Gyli][j]; 
greytemp = grey[ i][ j] ; 
if(abs(gx) »abs(gy) ) // 偏 向 x 方 癌 
| 
weight =fabs( gy ) /fabs( gx) ; 
if( gx * gy 20) // 在 第 一 或 第 三 象限 
| 
compl = grey[i][j*1] *(1- weight) + grey[i-1][j *1] * weight; 
comp2 = grey[i]|j-1] * (1 - weight) + grey[i+1][j-1] * weight; 
| 
else // 在 第 二 或 第 四 象限 
| 
compl = grey[i][j*1] * (1 - weight) + grey[i1](j 1] * weight; 
comp2 = grey[i]|j-1] * (1 - weight) + grey[i-1][j -1] * weight; 
| 


else // As] y 方向 
| 
weight = fabs( gx) /fabs( gy) ; 
if( gx * gy >0) // 在 第 一 或 第 三 象限 
| 
compl = grey[i-1][j] * (1 - weight) + grey[i-1][j *1] * weight; 
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comp2 = grey[i+1j[j]j*(1-=-weight) + grey[i-1][j -1] * weight; 
| 
else // 在 第 二 或 第 四 象限 
| 
compl = grey[i+1][j] * (1—weight) + greyļ[i+1][j+1] * weight; 
comp2 = grey[i-1][j] * (1 - weight) + grey[i-1][j -1] * weight; 
| 
| 
if( (greytemp > compl) && (greytemp > comp2) ) 
outgrey[i] [j] 2128; 
else 


outgrey[ i][ j] =0; 


| 
| 
void trace( int low , int x,int y) 
| 
int i,j; 
if( (x-1 > 20) && (y -1> 20) && (x+1 < 2255) && (y +1 < =255)) 
| 
for(i = -1;i<2;i+ +) 
for(j= -1;j <2;j+ +) 
if( (outgrey[ x +i] [y +j] = =128)&&(grey[ x +i][y +j] > =low)) 
| 
outgrey[ x +i] [y +j] 2255; 
trace(low,x +i,y +j); 
| 
| 
| 
@CCS 仿真 设置 
选择 CCS 设置 中 的 “Tools 一 Image Analyzer” 调 出 图 像 窗 口 ,右键 单 击 图 像 窗 口 选择 Prop- 
erties 进行 图 像 显示 配置 ,设置 与 第 6.2.3 节 图 6-3 相同 。 
@ 实 验 结果 
代码 (1) 梯 度 算 子 和 拉 普 拉 斯 算 子 程序 和 代码 (2)Canny 算 子 程序 分 别 以 EdgeDetection 
O RŽ Canny ( ) 函数 对 一 张 图 像 进行 边缘 检测 处 理 , 得 到 如 图 6-13 所 示 实 验 结果 ， 
图 6-13a) 为 处 理 前 的 原 图 像 ,图 6-13b ) 为 Robert 算 子 边缘 检测 ,图 6-13c) X Prewitt 算 子 边缘 
检测 ,图 6-13d) X Sobel 算 子 边缘 检测 ,图 6-13e) 为 拉 普 拉 斯 算 子 边缘 检测 ,图 6-13f) 为 Canny 
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算 子 边缘 检测 。 





Seripa Window Hep 





e) 拉 普 拉 斯 算 子 边缘 检测 f) Canny 算 子 边缘 检测 


图 6-13” 儿 种 边缘 检测 算 子 处 理 结 果 


6.4 区 域 分 割 





6.41 区域 生长 

其 度 赣 值 法 都 是 按照 单个 像素 点 的 灰 度 值 在 进行 区 域 分 市, 这 类 方法 分 割 的 区 域 往往 都 
是 不 连续 的 _ 相对 的 .区 域 分 割 的 实质 就 是 把 具有 某 种 相似 性 质 的 像素 点 连通 起 来 . 从 而 构成 
最 终 的 分 割 区 域 。 它 利用 了 图 像 的 局 部 空间 信息 ,可 有 效 的 克服 图 像 分 制 空 间 不 连续 的 缺点 ， 
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但 是 也 会 造成 图 像 的 过 度 分 割 。 在 此 类 方法 中 ,如 果 从 全 图 出 发 ,按照 区 域 属性 特征 一 致 的 准 
则 ,决定 每 个 像 元 的 区 域 归属 ,形成 区 域 图 , 称 之 为 区 域 生 长 ;如 果 从 像 元 出 发 ,按照 区 域 属性 
特征 一 致 的 准则 ,将 属性 相似 的 连通 像 元 聚集 为 区 域 , 称 之 为 区 域 增长 ;把 上 述 两 种 方法 综合 
起 来 ,就 称 为 分 裂 合并 。 这 类 方法 不 但 考虑 了 像素 的 相似 性 ,还 考虑 了 空间 上 的 邻接 性 ,因此 
可 以 有 效 消除 孤立 噪声 的 干扰 ,具有 很 强 的 鲁 棒 性 。 而 且 ,无 论 是 合并 还 是 分 裂 , 痢 能够 将 分 
割 深 入 到 像素 级 ,因此 可 以 保证 较 高 的 分 割 精度 。 

区 域 生 长 法 的 基本 思想 是 将 具有 相似 性 质 的 像素 合 起 来 构成 区 域 ,具体 做 法 是 选 定 图 像 
中 要 分 割 目标 内 的 一 个 小 块 作为 种 子 区 域 ,再 在 种 子 区 域 的 基础 上 不 断 的 将 其 周围 的 像素 点 
以 一 定 的 准则 加 入 到 其 中 ,将 这 些 新 像素 点 作为 新 的 种 子 区 域 ,继续 上 面 的 过 程 ,最 终 将 代表 
该 物体 的 所 有 像素 点 结合 成 一 个 区 域 。 

在 实际 应 用 区 域 生长 法 时 需要 考虑 以 下 3 个 问题 : 

(1) 如 何 选择 一 组 能 正确 代表 所 需要 区 域 的 种 子 像素 ”一 般 来 说 ,可 以 根据 具体 图 像 的 
特点 来 选取 种 子 像素 ,比如 ,我们 可 以 人 工 指定 ,也 可 以 选取 直方 图 中 满足 一 定 峰 宽 的 峰值 点 。 

(2) 如 何 确 定 在 生长 的 过 程 中 能 把 相 邻 像素 点 包括 进来 的 准则 ? 生长 准则 常常 与 具体 问 
题 相关 并 且 直接 影响 最 终 形成 的 区 域 ,如 果 选 择 不 恰当 ,将 会 造成 过 分 割 或 人 分割 的 现象 。 一 
般 来 说 ,可 以 定义 为 : |f(x,y) -mr|<7。 其 中 所 xz,y) 表 示 当 前 像素 的 灰 度 值 ,mn 表示 当前 区 
域 平均 灰 度 值 ,7 是 所 选 定 的 阐 值 。 

(3) 如 何 确定 生长 终止 的 条 件 ? 一 般 情况 下 , 当 区 域 无 法 继续 生长 时 ,就 停止 。 

区 域 生长 的 一 个 关键 问题 就 是 选择 合适 的 生长 准则 ,大 部 分 区 域 生长 的 准则 都 是 使 用 图 
像 的 局 部 特性 ,使 用 不 同 的 生长 准则 会 对 区 域 生长 的 过 程 造成 不 同 的 影响 。 这 里 介绍 2 种 常 
用 的 生长 准则 ; 

(1) 区 域 形状 准则 

可 以 利用 对 目标 形状 的 检测 结果 来 决定 区 域 是 否 应 该 合并 ,常用 的 方法 有 两 种 : 

人 b 把 图 像 分 割 成 灰 度 固定 的 区 域 , 设 两 邻 间 区 域 的 周 长 分 别 为 P, 和 P,, 将 两 区 域 间 共同 
边界 线 两 侧 的 灰 度 差 小 于 给 定 值 的 那 部 分 长 度 记 为 工 ,如 果 ( 了 为 预定 阔 值 ) : 


L 


min(P, P.) "T E 


则 合并 两 区 域 ; 
@) 把 图 像 分 割 成 灰 度 固定 的 区 域 , 设 两 邻 间 区 域 的 共同 边界 长 度 为 M, 把 两 区 域 间 共 同 边 
界线 两 侧 的 灰 度 差 小 于 给 定 值 的 那 部 分 长 度 设 为 工 ,如 果 (? 亿 为 预定 闭 值 ) 


5 >T, (6-29) 
则 合并 两 区 域 。 
(2) 灰 度 差 准则 
常用 的 区 域 灰 度 差 准 则 主要 由 以 下 4 个 步骤 组 成 。 
中 对 图 像 进行 一 一 扫描 , 找 出 还 没有 归属 的 像素 点 ,以 该 像素 点 为 中 心 检 查 它 邻 域 中 的 像 
素 点 ,将 邻 域 中 的 像素 点 一 一 与 它 进行 比较 ,如 果 灰 度 差 小 于 预先 确定 的 值 , 将 它们 合并 ,以 新 
本 
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合并 的 像素 点 为 中 心 ,检查 新 像素 点 的 邻 域 ,直到 区 域 不 能 进一步 扩张 为 止 ; 

@ 设 灰 度 差 的 阔 值 为 零 , 用 第 中 步 的 方法 进行 区 域 扩 张 ,将 灰 度 相同 的 像素 点 合并 ; 

@ 求 出 所 有 邻接 区 域 的 平均 灰 度 差 ,并 合并 具有 最 小 灰 度 差 的 邻接 区 域 ; 

@ 设 定 终止 条 件 , 通 过 反复 第 @ 步 中 的 操作 将 区 域 依 次 合并 直到 终止 条 件 满足 为 止 。 当 
图 像 中 存在 缓慢 变化 的 区 域 时 ,将 不 同 区 域 逐 步 合 并 有 可 能 产生 错误 。 为 克服 这 个 错误 ,可 以 
不 用 新 像素 点 的 灰 度 值 与 邻 域 像素 点 的 灰 度 值 进 行 比较 ,而 用 新 像素 点 所 在 区 域 的 平均 灰 度 
值 与 各 邻 域 像素 点 的 灰 度 值 进行 比较 。 对 一 个 含有 N 个 像素 点 的 图 像 区 域 尺 来 说 ,其 均 
值 为 : 


m= XfGsy) (6-30) 


对 像素 点 是 否 应 该 合并 的 比较 测试 表示 为 : 
max [f(x,y) -m|«T (6-31) 


其 中 f(x,y) 为 邻 域 像素 的 灰 度 值 ,7 为 给 定 的 闭 值 。 区 域 生 长 法 的 优点 是 计算 简单 并 且 
对 于 较 均 匀 的 连通 区 域 有 较 好 的 分 割 效果 。 它 的 缺点 就 是 需要 人 为 确定 种 子 , 并 且 对 噪声 比 
较 人 敏感 ,有 可 能 导致 区 域内 有 空洞 。 另 外 , 它 是 一 种 串 行 算法 , 当 目 标 较 大 时 ,分 割 速度 比较 
慢 , 因 此 在 设计 算法 的 时 候 , 要 尽量 提高 效率 。 


6.4.2 DREH 


区 域 分 裂 合 并 的 基本 思想 是 从 整 幅 图 像 开 始 通过 不 断 分 裂 得 到 各 个 区 域 ,实际 当中 常常 
先 把 图 像 分 成 任意 大 小 且 不 重 倒 的 区 域 ,然后 再 合并 或 者 分 裂 这 些 区 域 以 达到 分 割 的 要 求 。 
在 这 类 方法 中 ,最 常见 的 方法 是 四 又 树 分 解法 。 令 R 代表 整个 正方 形 图 像 区 域 ,如 图 6-14 所 
示 , 已 代表 逻辑 谓词 。 把 R 连续 的 分 裂 成 越 来 越 小 的 1/4 的 正方 形 子 区 域 R,, 并 且 始 终 使 P 
(R,) = True。 换 言 之 ,如 果 P(R) = False, 就 将 图 像 分 成 4 等 分 。 如 果 P(R,) = False, 就 将 RR 
分 成 4 等 分 。 如 此 类 推 ,直到 R, 为 单个 像素 。 





a) 正方 形 图 像 区 域 b) 四 叉 树 
图 6-14 图 像 的 四 又 树 分 解 示 意图 


如 果 仅 仅 使 用 分 裂 ,有 可 能 出 现 相 邻 两 个 区 域 具有 相同 的 性 质 但 并 没有 合成 一 体 的 情况 。 
为 了 解决 这 个 问题 ,在 每 次 分 裂 后 允许 将 其 继续 分 裂 或 者 合并 。 如 果 合 并 , 则 必须 满足 条 件 P 
(R,UR,) = True ZIET AEK: R, 和 RR 合并 起 来 。 
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一 般 来 说 ,分 裂 合 并 法 有 以 下 3 个 步骤 组 成 . 

(1) 对 任何 一 个 区 域 R,, 如 果 P(R,) = False ,就 将 其 分 裂 成 不 重叠 的 四 等 分 ; 

(2) 对 相 邻 的 两 个 区 域 R, 和 RR, 如 果 PCR; UR,) = True, 就 将 它们 合并 起 来 ; 

(3) 如 果 进 一 步 的 分 裂 或 者 合并 都 不 可 能 , 则 结束 。 

分 裂 合并 法 的 关键 是 设计 分 裂 合 并 准则 ,分裂 合 并 准则 的 好 坏 直 接 影响 着 分 割 的 效果 。 
该 方法 对 复杂 图 像 的 分 割 效果 比较 好 ,但 也 有 自身 的 不 足 。 一 方面 ,分 裂 如 果 不 能 深 达 像素 级 
就 会 降低 分 割 精度 ; 另 一 方面 , 深 达 像素 级 的 分 裂 会 增加 合并 的 工作 量 , 从 而 大 大 提高 其 时 间 
复杂 度 。 

6.4.3 分水岭 算法 

分 水 岭 算法 是 一 种 较 新 的 基于 区 域 的 图 像 分 割 算法 ,该 算法 的 思想 来 源 于 洼地 积 水 ,如 
图 6-15 所 示 ,其 具体 过 程 如 下 : 

(1) 求 取 梯 度 图 像 ; 集 水 盆地 

(2) 将 梯度 图 像 看 成 一 个 高 低 起 伏 的 地 形 图 ， 
原 图 中 较 平 坦 的 区 域 梯度 值 较 小 ,构成 盆地 , 原 图 分 水 内 
中 边界 的 区 域 梯度 值 较 大 , 则 构成 分 割 盆地 的 


Ur s 
(3) 水 从 盆地 最 低洼 的 地 方 渗入 , 随 着 水 位 不 
斯 上 涨 , 有 的 洼地 可 能 将 被 连通 ,为 了 防止 两 块 洼 极 小 点 
地 被 连通 ,就 在 分 割 两 者 的 山脊 上 筑 起 水 坝 , 水 位 图 6-15 “分 水 岭 算法 


越 涨 越 高 ,水 坝 也 越 筑 越 高 ; 

(4) 当 水 坝 达 到 最 高 山 峭 的 高 度 时 ,算法 结束 ,每 一 个 孤立 的 集 水 盆地 对 应 一 个 分 割 
区 域 。 

分 水 岭 算 法 有 多 种 实现 方法 ,vincent 等 人 给 出 了 一 种 新 的 实现 方法 ,该 方法 由 排序 和 淹 
没 两 个 步骤 组 成 ,其 优点 是 计算 速度 快 结果 准确 , 且 具 有 一 定 的 实用 价值 。 

近年 来 ,基于 分 水 岭 算 法 的 形态 学 分 割 方法 受到 极 大 关注 ,该 方法 计算 速度 快 ,并 且 能 精 
确定 位 图 像 的 边缘 ,但 是 它 存在 严重 的 过 分 割 现象 ,应 该 如 何 克 服 过 分 割 现象 一 直 是 图 像 分 割 
技术 研究 中 的 热点 。 一 般 来 说 ,克服 过 分 割 的 方法 可 以 分 为 两 种 : 

(1) 在 使 用 分 水 岭 算法 之 前 , 先 对 图 像 滤波 ,进行 标记 提取 ,从 而 有 效 的 抑制 噪声 引起 的 
过 分 割 现 象 ; 

(2) 在 使 用 分 水 岭 算 法 之 后 ,通过 一 定 的 合并 准则 将 小 区 域 合 并 到 相 邻 区 域 中 。 小 区 域 
合并 准则 可 以 分 为 三 类 ， 

Q@ 灰 度 闭 值 合并 ,认为 分 水 岭 算法 后 的 各 小 区 域 的 灰 度 值 在 同一 个 灰 度 范围 内 就 属于 同 
一 个 物体 ; 

@) 结 合 灰 度 和 面积 信息 的 区 域 合 并 ,在 进行 灰 度 闭 值 合 并 之 前 计算 出 各 小 区 域 所 包含 像 
素 的 大 小 ,将 小 于 设 定 的 最 小 像素 数 的 区 域 简单 的 合并 到 与 其 相 邻 的 小 区 域 中 ; 

(8 结合 灰 度 和 空间 拓扑 关系 的 区 域 合并 ,考虑 到 各 小 区 域 的 灰 度 和 空间 位 置 ,效果 比 前 两 
类 方法 明显 ,其 中 分 级 区 域 合 并 效果 较为 理想 。 
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6.5 Hough 变换 


Hough 变换 是 利用 图 像 全 局 特性 而 将 边缘 像素 连接 起 来 组 成 区 域 封 闭 边 界 的 一 种 方法 。 
在 预先 知道 区 域 形 状 的 条 件 下 ,利用 Hough 变换 可 以 方便 地 得 到 边界 曲线 而 将 不 连续 的 边缘 
像素 点 连接 起 来 。Hough 变换 的 主要 优点 是 抗 噪声 能 力 强 ,能 够 在 信 品 比比 较 低 的 条 件 下 , 检 
测 出 直线 或 解析 曲线 。 它 的 缺点 是 需要 先 做 二 值 化 以 及 边缘 检测 等 图 像 预 处 理工 作 ,使 输入 
图 像 转变 成 宽度 为 一 个 像素 的 直线 或 曲线 形式 的 点 阵 图 。 但 是 ,在 预 处 理 之 后 ,原始 图 像 中 的 
许多 信息 将 损失 ,例如 原始 图 像 中 的 大 部 分 灰 度 信息 在 做 了 处 理 后 将 丢失 ;又 如 原 图 经 边缘 检 
测 后 ,像素 之 间 的 许多 关系 也 将 丢失 。 由 于 这 个 原因 ,应 用 价值 带 来 了 一 定 的 局 限 性 。 


6.5.1 Hough 变换 的 原理 


Hough 变换 ,把 二 值 变 换 到 Hough 参数 空间 ,在 参数 空间 用 极 值 点 的 检测 来 完成 目标 的 检 
测 。 下 面 首先 以 直线 为 例 , 说 明 Hough 变换 的 原理 。 
对 一 直角 坐标 系 中 的 直线 ,其 方程 可 以 写成 
p =xcosg +ysing (6-32) 
" 参数 p 和 9 可 以 唯一 地 确定 一 条 直线 ,如 图 6-16 所 示 。 
p 是 原点 到 直线 的 距离 ,9 是 直线 的 法 线 与 X 轴 的 夹 角 , 换 
句 话 说 ,p 和 8 是 原点 到 直线 的 矢量 长 度 和 方向 。 现 在 ,以 
式 (6-32) 作 为 X-Y 坐标 向 p — 0 坐标 变换 的 方程 ,进行 
XX- 了 平面 内 点 集 的 变换 。 对 于 -了 平面 内 的 点 (xo ,Yo)， 
> 变换 方程 为 : 
p =xocos0+yosing 2 Asin(a +0) (6-33) 
式 中 ,a = aretan(x,/y,) ;A = Je - y, XE p -9 平面 
^m X 内 是 一 条 正弦 曲线 ,其 初始 角 a 和 振幅 4 BE x, A y 的 值 而 
图 6-16 参数 表示 变 。 若 将 成 -了 平面 内 在 同一 条 直线 上 的 一 个 点 序列 变换 
到 p -9 平面 内 , 则 所 有 正弦 曲线 都 经 过 一 点 (po ,9,),(po,0。) 对 应 于 这 条 直线 到 原点 的 距离 
和 法 线 与 X 轴 的 夹 角 。 所 有 正弦 曲线 在 p -9 平面 内 其 他 各 处 均 不 相交 。 因 此 ,在 极限 情况 
下 ,将 X- 了 平面 内 一 条 直线 上 的 无 数 点 变换 到 p -9 平面 上 时 ,经 过 (po ,9 ) 的 次 数 为 无 穷 ,经 
过 其 他 各 处 次 数 都 为 1。 也 就 是 说 ,该 变换 将 -了 平面 内 的 一 条 直线 变 成 了 p -9 平面 的 一 
个 点 ,该 点 的 坐标 为 -了 坐标 原点 到 该 直线 的 方向 矢量 的 长 度 和 方向 。 
因此 ,如 果 要 检测 图 像 中 的 直线 ,可 以 建立 二 维 累 加 数组 4, 其 元 素 可 以 写成 为 4(p,9)。 对 
于 二 值 图 像 上 的 每 个 目标 点 (x。 ,yo) ,让 9 依次 变化 而 根据 式 (6-33 ) 计算 p, 对 于 满足 式 (6-33) 
的 (p,9) ,使 4 中 的 对 应 元 素 累 加 , 即 4(p,9) =4(p,9) +1。 所 有 的 目标 点 计算 完成 后 , 累加 
数组 中 最 大 值 的 点 就 对 应 了 直线 的 参数 。 因 此 ,Hough 变换 把 直线 检测 问题 转换 到 参数 空间 
里 对 点 的 检测 问题 ,通过 在 参数 空间 进行 简单 的 累加 统计 完成 检测 任务 。 
对 于 圆 , 可 以 写 其 方程 ; 
(x-a)! «(y -b)? =R (6-34) 
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这 时 参数 空间 增加 到 三 维 ,由 a、b、R 组 成 。 如 果 仍 然 像 直线 那样 直接 计算 ,计算 量 和 存 
储 空间 都 将 显著 增 大 。 
如 果 贺 的 边沿 元 已 知 , 则 可 以 简化 为 二 维 的 问题 。 因 为 把 式 (6-34) 对 x 取 导 数 ,有 : 


2(x -a) +2(y - b) SE -0 (6-35) 


这 表示 参数 a 和 不 独立 ,利用 这 个 关系 , 解 式 (6-34) 只 需 2 个 参数 组 成 参数 空间 ,计算 
量 减少 了 很 多 。 在 人 为 景物 中 圆 形 物体 经 常 出 现 , 经 过 透视 成 像 后 由 圆 变 成 椭圆 。 寻 找 椭圆 
的 算法 可 以 仿照 寻找 圆 的 算法 来 进行 。 


VERE IU T ERA : 
Ur 88) UTR) < (6-36) 
a b 
取 导 数 有 : 
xo Y-—-Yody | : 
Tub od doe (6-37) 
可 以 看 出 这 里 有 3 个 独立 参数 。 如 果 椭 圆 主轴 不 平行 于 坐标 轴 , 则 可 写 为 : 
Ax? + Bxy + Cy! + Dx+Ey+1=0 (6-38) 


在 利用 过 椭圆 边沿 的 方向 信息 后 ,在 映射 空间 的 独立 参数 仍 有 四 个 之 多 ,为 了 简化 求 椭圆 
的 计算 ,还 需要 其 他 的 特殊 解法 ,这 里 就 不 多 介绍 了 。 


6.5.2 Hough 变换 的 买 现 


在 本 节 中 我 们 将 结合 上 述 的 理论 给 出 具体 的 实现 方法 ,包括 Matlab 的 仿真 实现 以 及 基于 
C 语言 的 DM642 代码 ,以 便 读 者 深入 了 解 Hough 变换 的 特点 ,掌握 其 实现 方法 。 

下 面 我 们 来 说 明 如 何 利 用 Hough 变换 来 检测 图 像 中 最 长 的 直线 。 检 测 的 步 又 如 下 : 

(1) 初 始 化 一 个 变换 域 p.2 空间 数组 ,p 方向 上 的 量化 数目 为 图 像 对 角 线 方向 的 像素 数 ,9 
方向 上 的 量化 数目 为 180( 角度 从 0° 一 180°, 每 格 2°); 

(2) 顺 序 搜索 图 像 中 的 所 有 黑 点 。 对 每 一 个 黑 点 ,在 变换 域 的 对 应 点 上 加 1; 

(3) 求 出 变换 域 中 的 最 大 值 点 记录 ; 

(4) 画 出 最 大 点 对 应 的 直线 。 

1. Matlab 实现 

(1) Hough 变换 的 M 文件 

A = imread( 'G ; Minegray. bmp') ; 

[ height, width] = size( A) ; 

uint16 SegmeMax ; 

uint16 SegmeNum; 

uint16 AngleMax ; 

—1235'— 


图 像 处 理 与 机 器 视觉 


uintl6 AngleNum; 

uint16 LongSeg; 

uint16 LongAng; 

uint16 Long; 

Long 20 

SegmeMax = uintl6 ( sqrt( height * height + width * width) ) ; 
AngleMax 2180; 

C = zeros( SegmeMax , AngleMax ) ; 
C 2 uintl6( C) ; 

D = zeros( height ,width ) ; 

D - uint8( D) ; 


for i = 1 ; height 

for j 2 1 : width 
D(i,j) 2255; 

end 

end 

B = zeros( height , width ) ; 

B = uint8( B) ; 

uint8 t; 

uint8 T; 

uint8 Gmax; 


uint8 Gmin; 


t 20; 

T 20; 
Gmax 20; 
Gmin 2255; 
uint8 flag; 
flag z1; 


double ForegroundNum ; 
double BackgroundNum; 
double ForegroundSum; 
double BackgroundSum; 
double ForegroundMean ; 
double BackgroundMean; 
for i 2 1: height 
for j = 1: width 
temp = A(1,j) ; 
= 2306 =— 
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if temp < Cmin 
Gmin = temp; 


end 


if temp > Gmax; 
Gmax - temp; 
end 
end 
end 
T = ( Gmax + Gmin)/2; 
while ( flag) 
ForegroundNum =0; 
BackgroundNum =0; 
ForegroundSum =0; 
BackgroundSum =0; 
for i = 1 :height 
for j 21:width 
temp = A(i,j); 
if temp >T 
ForegroundNum = ForegroundNum + 1 ; 
ForegroundSum = ForegroundSum + double( temp) ; 
else 
BackgroundNum = BackgroundNum + 1; 
BackgroundSum = BackgroundSum + double ( temp) ; 
end 
end 
end 
ForegroundMean = ForegroundSum/ ForegroundNum ; 
BackgroundMean = BackgroundSum/ BackgroundNum; 
t = uint8( ( ForegroundMean + BackgroundMean ) 72) ; 


让 了 = =t 
flag 20; 
else 
quss 
end 
end 
for i = 1: height 


cfc 
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for j =1:width 
if A(1,j) «T 
B(i,j) «0; 
else 
B(1,]) 2255; 
end 
end 
end 
for iz 1 -height 
for j = 1:width 
pixel 2 B(1,j) ; 
if pixel = 20 
for AngleNum = 1 ; AngleMax 
SegmeNum = uintl6( abs(j * cos( AngleNum * pi/180. 0) +i * sin( AngleNum * pi/180.0) ) +1); 
C ( SegmeNum, AngleNum) = C( SegmeNum, AngleNum) +1; 
end 
end 
end 
end 
for SegmeNum = 1 ; SegmeMax 
for AngleNum = 1 : AngleMax 
if C( SegmeNum, AngleNum) > Long 
Long = C( SegmeNum , AngleNum) ; 
LongSeg = SegmeNum; 
LongAng = AngleNum; 


end 
end 
end 
for i = 1 ; height 
for j = 1 : width 
iB 5-0 
SegmeNum - uintl6( abs(j * cos( LongAng * pi/180) +i * sin( LongAng * p/180) ) ) ; 
if SegmeNum - LongSeg = =0 
D(i,j) 20; 
end 
end 
end 
end 
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figure(1); 

imshow( A) ; 

title(' 原始 图 像 ) ; 

figure(2); 

imshow( B); 

title(' 二 值 图 像 ') ; 

figure(3); 

imshow(D ) ; 

title(! 最 长 直线 ) ; 

(2) Hough 变换 Matlab 仿真 结果 (图 6-17 ) 


WU qm ut 


a) 原始 图 像 b) 二 值 化 后 图 像 0c) 检测 出 的 最 长 直线 
图 6-17 Hough 变换 结果 

2. 基 于 DM642 系统 的 Hough 变换 程序 

这 里 基于 TMS320DM642 DSP 平台 给 出 Hough 变换 算法 的 C 语言 实现 。 

(1)CCS 图 像 查看 设置 

CCS 图 像 查看 设置 如 图 6-18 所 示 。 


(Bi mage |CiPreperies i LLL EB S 7-8 





Property Value ] 
4 General | 
Title | 
Background color RGB (255, 255, 255) | 
Image format RGB | 
4 RGB | 
Number of pixels per line 512 | 
Number of lines 350 
Data format Planar 
Pixel stride (bytes) 1 ] 
Red mask OxFF | 
Green mask OxFF | 
Blue mask OxFF 
Alpha mask (if any) 0x00 
Line stride (bytes) 512 ] 
Image source Connected Device | 
Red start address input 
Green start address input 
` Biue start address input - 了 PME 
Alpha start address (if any) 
Read data as 8 bit data 








图 6-18 CCS 图 像 查看 设置 


(2)DM642 程序 


= 
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#include < stdio. h > 
#include < stdlib. h > 
#include < math. h > 
#define pi 3. 14159 
#define Width 512 
#define Height 350 
#define Deep 256 
#define Segment 620 
#define Angle 180 
#pragma DATA, SECTION( input, ''. my, sect") 
#pragma DATA, SECTION( binary , ". my, sect") 
Spragma DATA, SECTION( output , ". my, sect") 
spragma DATA, SECTION( polar, ''. my, sect" ) 
unsigned char input| Height | | Width | ; 
unsigned char binary| Height | [ Width | ; 
unsigned char output| Height | | Width ] ; 
long polar| Segment | | Angle | ; 
void ReadImage( char * cFileName) ; 
void bmpDataPart( FILE * fpbmp ) ; 
void iteration( ) ; 
void hough( ) ; 
void main( ) 
| 
/* 图 像 */ 
ReadImage( "G ; Minegray. bmp") ; 
iteration( ) ; 
hough( ) ; 
while (1); 
| 
void ReadImage( char * cFileName) 
| 
FILE * fp; 
if ( fp = fopen( cFileName , "rb" ) ) 
| 
bmpDataPart ( fp) ; 
fclose( fp) ; 
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void bmpDataPart( FILE * fpbmp) 
! 


int i, j =0; 
unsigned char * pix = NULL; 
fseek (fpbmp, 1078L, SEEK, SET) ; 
pix = (unsigned char * ) malloc ( Width ) ; 
for(j =0;j < Height;j + + ) 
| 
fread(pix, 1, Width , fpbmp) ; 
for(i =0;i < Width;i + +) 
| 
input[ Height -1 -j][i]  =pix[i]; 
| 


| 

void iteration( ) 

| 
int 1, j 

unsigned char T,t; 
unsigned char Gmax; 
unsigned char Gmin; 
unsigned char flag; 
unsigned char temp; 
double ForegroundNum ; 
double BackgroundNum; 
double ForegroundSum ; 
double BackgroundSum ; 
double ForegroundMean ; 


double BackgroundMean ; 


tz05 

T 20; 
Gmax 20; 
Gmin 2 255; 
flag 21; 


for(i =0;i < Height;i + +) 
| 
for(j 20;j < Width;j + +) 
| 
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| 


temp = input i]| j] ; 
if( temp < Gmin) 
| 
Gmin = temp; 
f 
if( temp > Gmax) 


| 
t 


Gmax = temp; 


T = ( Gmin + Gmax )/2; 
while ( flag) 


| 


ForegroundNum - 0; 
BackgroundNum 20; 
ForegroundSum - 0; 
BackgroundSum =0; 
for(i =0;i < Height;i + +) 
| 
for(j 20;j < Width;j + +) 
| 
temp =inpat[ i] [j]; 
if(temp > T) 


1 


1 
ForegroundNum = ForegroundNum +1; 


ForegroundSum = ForegroundSum + ( double) temp; 


BackgroundNum = BackgroundNum + 1 ; 
BackgroundSum = BackgroundSum + ( double) temp; 


| 

ForegroundMean = ForegroundSum/ ForegroundNum ; 
BackgroundMean = BackgroundSum/ BackgroundNum; 

t = (unsigned char) ( ( ForegroundMean + BackgroundMean) 72) ; 
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if(t == T) 
flag =0; 
else 
T zs 





} 
for(i =0;i < Height;i + +) 
| 
for(j 20;j < Width;j + +) 
| 
temp = input[ i] [j]; 
if(temp « T) 
| 
binary[i][j] =0; 
| 
else 
| 
binary[ i][j] 2255; 


| 
void hough( ) 
| 
int 1,]; 
int p,0; 
long Line; 
int LineSeg; 
int LineAng; 
unsigned char pixel ; 
Line 20; 
for(i =0;i < Height;i + +) 
| 
for(j =0;j<Width;j+ +) 
| 
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output[ i] [j] 2255; 
| 


for(i =0;i < Segment;i + +) 
| 
for(j 20;j < Angle;j + +) 
| 
polar[ i][j] 20; 
| 
for(i =0;i < Height;i + +) 
| 
for(j =0;j < Width;j + +) 
| 
pixel = binary[ i] [j]; 
if(pixel = = 0) 
| 
for(o 20;o < Angle;o + +) 
| 
p=(int)fabs(j * cos(o* pi/180.0) + i*sin(o* pi/180.0)); 
polar[ pj [lo] =polar[pj[o] +1; 


for(i=0;i< Segment;i+ +) 
| 
for(j =0;j < Angle;j + +) 
| 
if(polar[i][j] > = Line) 
| 
Line = polar i] [j]; 
LineSeg =i; 
LineAng =j; 


| 
for(i =0;i < Height;i + +) 
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for(j =0;j<Width;j+ +) 
| 
if(binary[i][j] == 0) 
| 
p = Cint)fabs(j * cos( LineAng * pi/180.0) i * sin(LineAng * pi/180.0)); 
if( p - LineSeg = = 0) 
| 
output[ i][j] 20; 


| 
(3)CCS 仿真 结果 (图 6-19) 








这 bd matter eril | 
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c) 最 长 直线 
图 6-19 CCS 仿真 结果 
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6.6 本章 小 结 


图 像 分 割 是 图 像 从 预 处 理 到 图 像 识 别 和 分 析 的 重要 步骤 ,本 章 着 重 介 绍 了 基于 阅 值 的 分 
割 法 基于 边缘 的 分 割 法 和 基于 区 域 的 分 割 法 ,讨论 分 析 了 每 种 方法 的 优点 和 局 限 性 ,在 每 种 
方法 中 ,都 给 出 了 相应 的 Matlab 和 DM642 程序 ,便于 读者 学 习 参考 。 





1. 解释 为 什么 Robert 算 子 Sobel 算 子 和 拉 普 拉 斯 算 子 进行 边缘 检测 的 效果 是 不 同 的 ? 

2. Sobel 算 子 采用 垂直 和 水 平 两 个 模板 分 别 检测 图 像 中 水 平和 垂直 两 个 方向 的 边缘 ,请 按 
照 这 一 思想 ,设计 出 一 个 模板 ,使 其 能 检测 图 像 中 45° 方 向 的 边缘 。 

3. 试 证 明 拉 普 拉 斯 算 子 是 各 向 同性 (旋转 不 变性 ) 的 , 即 f(x,y) 旋 转 0 以 后 拉 普 拉 斯 算 子 
的 值 不 变 。 

4. 能 否 按照 Sobel 算 子 的 原理 自行 改变 权 值 设计 一 个 边缘 检测 算 子 ? 能 的 话 要 注意 哪 
些 ? 请 尝试 用 自行 设计 的 边缘 检测 算 子 对 图 像 进行 边缘 检测 ,并 比较 与 其 他 算 子 效果 的 异同 。 
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7.1 前 言 


图 像 复 原 是 图 像 处 理 重要 的 研究 领域 。 在 成 像 过 程 中 ,由 于 成 像 系统 各 种 因素 的 影响 ,可 
使 获得 的 图 像 不 是 真实 景物 的 完整 影像 。 图 像 在 形成 .传播 和 保存 过 程 中 使 图 像 质 量 下 降 的 
过 程 称 为 图 像 的 退化 。 图 像 复 原 就 是 重建 退化 的 图 像 , 使 其 最 大 限度 恢复 景物 原貌 的 
处 理 。 

图 像 复原 的 概念 与 图 像 增 强 相似 。 但 图 像 增强 可 以 针对 本 来 完善 的 图 像 , 经 过 某 一 处 理 ， 
使 其 适合 某 种 特定 的 应 用 ,是 一 个 主观 的 过 程 。 图 像 复 原 的 目的 也 是 改善 图 像 质量 ,但 图 像 复 
原 更 偏向 于 利用 退化 过 程 的 先 验 知识 使 退化 图 像 恢 复 本 来 面目 ,更 多 的 是 一 个 客观 过 程 。 引 
起 图 像 退化 的 因素 包括 光学 系统 、 运 动 图 像 模糊 以 及 源 自 电路 和 光学 因素 的 噪声 等 。 图 像 复 
原 是 图 像 退化 数学 模型 ,复原 方法 也 建立 在 比较 严格 的 数学 推导 上 。 部 分 复原 技术 已 经 在 空 
域 公式 化 了 ,可 以 方便 地 套用 ;而 另 一 些 技术 则 适用 于 频 域 。 


7.2 图 像 退化 模型 


图 像 复 原 处 理 的 关键 是 建立 退化 模型 ,一 个 简单 的 通用 图 像 退 化 模型 可 将 图 像 退 化 过 程 
模型 转化 为 一 个 作用 在 原始 图 像 (x,y) 上 的 退化 系统 厂 , 作 用 结果 与 一 个 加 性 噪声 n(x,y) 的 


联合 作用 产生 退化 图 像 g(x,y) ,如 图 7-1 所 示 。 pd 

实际 的 成 像 系 统 在 一 定 条 件 下 可 以 近似 地 看 作 是 
有 Geu») 
不 变 的 系统 模型 。 图 7-1 图 像 的 退化 模型 


数字 图 像 复 原 可 以 看 成 一 个 预测 估计 的 过 程 ,是 要 在 给 定 g(x,y) 和 退化 系统 五 的 基础 上 
得 到 对 了 (x,y) 的 某 个 近似 过 程 ,由 退化 图 像 g(x,y) 估 计 出 系统 参数 万 ,从 而 近似 地 恢复 出 / 
(x,y) ,n(x%,y) 为 一 种 统计 性 质 的 信息 。 我 们 希望 复原 数字 图 像 最 大 可 能 接近 原 数字 图 像 , 如 
果 对 降 质 函数 和 加 性 噪声 了 解 得 越 多 , 则 复原 的 数字 图 像 将 越 接近 原 数字 图 像 。 为 了 对 处 理 
结果 做 出 某 种 最 佳 估计 ,一 般 还 应 首先 确定 一 个 质量 标准 。 复 原 处 理 的 基础 在 于 对 系统 的 
基本 了 解 。 系 统 是 由 某 些 元 件 或 部 件 以 某 种 方式 构造 而 成 的 整体 ,系统 本 身 所 具有 的 某 些 特 
性 就 构成 了 通过 系统 输入 信号 与 输出 信号 的 某 种 联系 ,这 种 联系 从 数学 上 可 以 用 算 子 或 响应 
函数 h(x,y) 来 描述 。 一 般 来 说 ,对 数字 图 像 的 一 次 复原 操作 可 以 看 作 是 对 图 像 的 一 次 滤波 。 

这 样 图 像 退化 过 程 的 数学 表达 式 就 可 以 写 为 
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g(x,y) =HLf(x, y)] +n(x,y) (7-1) 


H| ，] 可 理解 为 综合 所 有 退化 因素 的 函数 或 算 子 。 
从 上 述 降 质 模型 可 以 看 到 ,图 像 的 降 质 过 程 是 一 个 正 问题 ,而 图 像 的 复原 过 程 是 一 个 反问 
题 。 在 不 考虑 加 性 噪声 n(x,y) 时 ,图 像 退化 的 过 程 也 可 以 看 作 是 一 个 变换 瑟 , 对 此 ,可 以 采用 
算 符 理论 加 以 描述 。 
H[f(x,y) ]-^g(x,y) (7-2) 
由 g(x,y) 求 得 fx,y) AR oet H 8 Hay) >gay) 。 从 数学 意义 
iE, PR L DA TEN BRE T C E 2 ETE PEAME — PETEJA, 
由 上 述 可 知 ,图 像 复原 的 过 程 ,就 是 根据 退化 模型 及 原 图 像 的 某 些 知 识 , 设 计 一 个 恢复 系 
统 p(x,y) ,以 退化 图 像 g(x,y) 作 为 输入 ,该 系统 应 使 输出 的 恢复 图 像 f(x,y) ， 按 某 种 准则 最 
接近 原 图 像 f(x,y) ,图 像 的 退化 及 复原 的 过 程 如 图 7-2 所 示 。 
n(x, y) 
fe» O fe 
g(x,y) 
图 7-2 图 像 退 化 及 复原 的 过 程 
其 中 有 h(x,y) 和 p(x,y) 分 别 是 成 像 系 统 和 恢复 系统 的 冲 激 响应 。 
系统 的 分 类 方法 很 多 ,可 分 为 线性 系统 和 非 线性 系统 ,时 变 系统 和 非 时 变 系统 ,集中 参 
数 系统 和 分 布 参数 系统 ,连续 系统 和 离散 系统 等 。 
线性 系统 具有 均匀 性 和 相 加 性 ,这 些 特性 为 求解 多 个 激励 情况 下 的 输出 响应 带 来 很 大 方 
便 。 当 不 考虑 加 性 噪声 n(x,y) 时 , 即 令 n(x,y) =0, 则 图 7-2 所 示 的 系统 可 表示 为 : 
gla yi =H] (7-3) 
两 个 输入 信号 e (my) ty y) 对 应 的 输出 信号 HJ g(x,y) An x,y) ,如 果 
H[kfi(x,y) *bfo(x,y)] S HÜk f (x,y)] e Hf (x.y)] =kigi (x,y) + bg (x,y) 
(7-4) 
成 立 , 则 系统 五 是 一 个 线性 系统 ,hh 为 常数 。 由 式 (7-4) 可 知 ,线性 系统 对 两 个 输入 信号 之 
和 的 响应 等 于 它 对 两 个 输入 信号 响应 的 和 ,线性 系统 对 常数 与 任何 输入 乘积 的 响应 等 于 常数 
与 该 输入 的 响应 的 乘积 。 
如 果 一 个 系统 的 参数 不 随时 间 变 化 , 即 称 为 时 不 变 系统 或 非 时 变 系 统 , 否 则 ,该 系统 为 时 
变 系统 。 与 此 相对 应 ,对 二 维 函数 来 说 ,如 果 
H[f(s -a,y-B)] -g(x-a.y-B) (7:5) 
则 五 是 空间 不 变 系统 (或 称 位置 不 变 系 统 )。 式 中 ,a\B 分 别 为 空间 位 置 的 位 移 量 , 表 示 
图 像 中 的 任意 位 置 的 响应 只 与 在 该 位 置 的 输入 值 上 有关, 而 与 该 点 的 位 置 本 身 无 关 。 


在 进行 图 像 复原 处 理 时 , 随 着 实际 中 的 空间 变化 , 非 线 性 系统 模型 更 具有 准确 性 和 普遍 
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性 ,但 常常 出 现 没有 解 或 者 很 难 通 过 计算 机 来 处 理 的 情况 ,给 工作 带 来 很 大 的 困难 ,所 以 一 般 
采用 线性 和 空间 不 变 的 系统 模型 。 
7.2.1 连续 的 退化 模型 
单位 冲 激 函数 5(1) 是 一 个 振幅 在 原点 之 外 所 有 时 刻 为 零 , 而 在 原点 处 振幅 为 无 穷 大 , 宽 
度 无 限 小 ,面积 为 1 的 罕 脉 冲 ,其 时 域 表 达 式 为 . 
oo ESH 
8(t) = JO 1 天 0 (7-6) 


| oa s 


8(1) 的 卷 积 取样 公式 为 ， 
Ka) = [f -1)8()d (77) 
, 5 
Ka) = [f - 0d (T8) 
ERER ARR S1) 可 推广 到 二 维 空间 域 中 ,从 而 可 把 /sx,y) 写成 下 列 形式 ; 
fe) =| [Kapal -ay-B)dadp (7-9) 


由 于 g(x,y) 2 HLf(x,y) ] *n(x,y) WRS n(x,y) =0, 即 不 考虑 加 性 噪声 时 ,同时 考虑 
到 五 为 线性 算 子 , 则 
glay) = H[f(n,y)] 


= 丰 [ f(a,B)8(x - a,y - B) dadp] 
-[ [BUG 8 - a,y -B)]dad8 


- [fta B) HEB - a,y - B) 1dadg (1-10) 
4 h(x,a,y,B) 2 H(8(x -asy-B)], 则 有 
Gy) = [ [Lf oh Gay B) dadg (7-11) 


式 中 ,h(x,a,y,B) 为 系统 五 的 冲 激 响 应 , 即 h(x,a,y,B) 是 系统 厂 对 坐标 为 (a,B) 处 冲击 
函数 8(x -a,y -B) 的 响应 。 在 光学 中 冲 激 为 一 光 点 ,因此 又 将 h(x,a,y,B) 称 为 退化 过 程 的 
点 扩散 函数 (PSF ) 。 

式 (7-11) 说 明 , 当 系 统 及 对 溃 击 函数 的 响应 为 已 知 , 则 对 任意 输入 /(x,y) 的 响应 均 可 由 
该 公式 求 得 ,也 就 是 说 ,线性 系统 万 完全 可 由 其 冲击 响应 来 表征 。 

当 系统 万 空间 位 置 不 变 时 , 则 

h(x,a,y,B) = 可 5(z,a,y,B) ] (7-12) 

这 样 就 有 

gy) = {| fh -ay -B)dadB (7-13) 
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由 式 (7-13 ) 可 见 , 由 于 把 退化 过 程 看 成 一 个 线性 空间 不 变 系统 ,因此 系统 输出 的 降 质 图 像 
g(x,y) 应 为 输入 图 像 f(x,y) 和 系统 冲 激 响应 的 卷 积 。 对 式 (7-13 ) 两 边 进行 傅立叶 变换 ,并 由 
卷 积 定理 可 得 

G(u,v) 2 H(u,v) F(u,v) (7-14) 

式 中 ,G(wu,v) .F(w,v) 分 别 为 g(x,y) (xy) 的 二 维 傅立叶 变换 ; 函数 H(u v) PREBE 
系统 的 传递 函数 ,是 退化 系统 冲 激 响应 h(x,y) 的 傅立叶 变换 。 

考虑 加 性 噪声 n(x,y) 时 , 式 (7-11) 可 写成 

g(x,y) = [7 [fto Bh asy B) dadB + n(x,y) (7-15) 

或 

G(u,v)  H(u,v) F(u,v) * N(u,v) (7-16) 

WP, N u,v) AIRE RR n (x, y) 的 傅立叶 变换 , 且 n(x,y) 与 图 像 中 的 位 置 无 关 。 

大 多 数 情况 下 都 可 以 利用 线性 系统 理论 近似 地 解决 图 像 复 原 问题 。 当 然 在 某 些 特定 的 应 
用 中 ,讨论 非 线性 空间 可 变性 的 退化 模型 更 具 普遍 性 ,也 更 加 精确 ,但 在 数学 上 求解 困难 。 因 
此 ,本 章 只 讨论 线性 空间 不 变 的 退化 模型 。 

7.2.2 ”离散 的 退化 模型 


数字 图 像 讨论 的 是 离散 的 图 像 函数 ,因此 需 对 连续 模型 离散 化 ,即将 连续 模型 中 的 积分 用 
求 和 的 形式 表示 。 

在 连续 的 退化 模型 中 ,把 f(a,B) 和 h(x -ay-B) 进 行 均匀 取样 后 就 可 引申 出 离散 的 退 
化 模型 。 为 更 好 地 理解 离散 的 退化 模型 ,首先 用 一 维 函 数 来 说 明基 本 概念 ,然后 再 推广 至 二 维 
情况 。 

在 暂 不 考虑 噪声 项 的 情况 下 , 设 有 函数 妃 x) 被 均匀 取样 后 形成 具有 4 个 采样 值 的 离散 输 
入 函数 , h(x) 被 采样 后 形成 具有 B 个 采样 值 的 退化 系统 冲 激 响 应 ,于 是 f(x) 变 成 在 x 20,1, 
2,…,4 -1 范围 内 的 离散 变量 ,h(x) 则 变 成 在 x =0,1,2,…,B -1 范围 内 的 离散 变量 ;于 是 
f(x) 和 h(x) 的 连续 函数 退化 模型 中 连续 卷 积 关 系 就 变 成 离散 卷 积 关系 。 

E fx) FU h(x) RERA EWA N 的 序列 ,那么 ,它们 的 时 域 离散 卷 积 定义 为 

g(x) = Zf(m)h(x—m) (747) 

显然 ,g(x) 也 为 具有 周期 为 N 的 序列 ,周期 卷 积 可 以 用 常规 卷 积 法 计算 ,也 可 以 用 卷 积 定 
理 进行 快速 卷 积 计算 。 

若 f(x) 和 h(x) 均 为 非 周 期 性 的 序列 , 则 可 用 添 零 延 伸 方 法 延 拓 为 周期 函数 f (x) 
和 hh.(x) ,为 避免 折 秋 现象 ,可 令 周 期 MA +B -1, 表 示 如 下 : 


(K=) 0<x<4-1 
Tes i A-1<X<M-1 UI 
h(x) 0<x<B-1 
NIS a (7-19) 
0 B-1<X<M -1 
可 得 到 离散 卷 积 退 化 模型 
g(x) = Ef (m) h(x -m) (7-20) 
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式 中 ,x =0,1,2,…,MN-1;g。(x) 的 也 为 周期 为 M 的 函数 。 经 过 这 样 的 延 拓 处 理 , 一 个 非 
周期 的 卷 积 问 题 就 变 成 了 周期 卷 积 问题 了 ,因此 可 以 用 快速 卷 积 法 进行 运算 。 用 和 矩阵 形式 表 
述 离散 退化 模型 ,可 写成 ， 





g-Hf (7-21) 
Rm. 
fq £0)  Z£oOr-1] 
£7[g.(0 g (1) = g(M-1)]' 
五 是 M x M 阶 和 矩阵 
h.(0) hC -1) h (-2) =~ hC-M*1)] 
h.(1) h.(0) = 2) 
H=| h.(2) hi(1) h.(0) os cd ME) (7-22) 
h M=1) AM -2) hUOM-3) = h. (0) 
FIH h. (x) JARE, A (x) =h.( € M x) ,利用 此 性 质 上 式 可 写成 
[ h0)  AÀ(M-1) A(M-2) = h (1) 
h.(1) h(0)  A(M-1) = h,(2) 
H-| h,(2) h.(1) h.(0) we R3) (7-23) 
LA,(M-1) h(M-2) h (M-3) … h,(0) 





可 以 看 出 ,五 为 一 个 循环 矩阵 , 即 一 行 中 最 右 端 的 元 素 等 于 下 一 行 中 最 左 端 的 元 素 ,并 且 
此 循环 性 一 直 延 伸 到 最 末 一 行 的 最 右 端 元 素 ,又 回 到 第 一 行 之 首 。 
[ 例 7-1] 设 4=4,B=3,M=4+B-1=6, 则 有 


f(x) 0zxxx4-1 (x0, 12.3) 
f. (x) S 
0 4-1«xx6-1 (x 24,5) 
h(x) 0zxxzx3-1 x 20,1,2) 
h, (x) -| (7-24) 
3-1«xx6-1 (x 23,4,5) 


在 此 情况 下 Lf. (x) IL A, (x) 2928 6 维 列 向 量 ,五 为 6x6 EE, EIERE H ARIA 
h (0) h,(5) h,(4) h,.(3) h,(2) h.(1) 
h(1) h,.(0) h.(5) h,(4) h,.(3) h.(2) 
h.(2) h,(1) h,.(0) h,(5) h,(4) h3) 
H- (7-25) 
h. (3) h (2) h,(1) h,(0) h,.(5) h.(4) 
h (4) h.(3) h,.(2) h,(1) h,(0) h.(5) 
h,(5) h,.(4) h,.(3) h,(2) h,(1) h,(0) 


= 2l =—= 
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将 式 (7-24) 带 人 式 (7-25) 则 有 


h, (0) 0 0 0 h.(2) h.(1) 
h.(1) h,(0) 0 0 0 h.(2) 
h(2) h(1) h(0 0 0 0 
H- (7-26) 
O0  h(2) h(1) A(0 0 0 
0 0 h,.(2) h,(1) h,(0)0 
0 0 0  h,(2) A(1) h,(0) 


从 上 述 一 维 模型 可 以 推广 到 二 维 情况 。 如 果 给 出 A xB 大 小 的 数字 图 像 , 以 及 C x D 大 小 
的 点 扩散 函数 ,可 首先 扩展 成 大 小 为 Mx N 的 周期 延 拓 图 像 。 为 避免 折 释 ,要 求 M>4+C- 
1,N=B+D-1, 
f(x) O€x«xA-1 H OxyxB-1 


= 727 

fo) " -iess Hb B—1cysN-1 ITI 
h 0xxxC-1 H OxyxD-1 

h(a) =] us : : (728) 
0 C-lesmM-1 Hi D-I«yeN-1 


这 样 一 来 ,f.(x,y) 和 有 h.(x,y) 分 别 成 为 二 维 周 期 函数 ,它们 在 x RU y 方向 上 的 周期 分 别 为 
M 和 N。 由 此 得 到 二 维 退 化 模型 为 一 个 二 维 卷 积 形式 : 


g(x,y) = E, E f, (mn) h (x -m,y 2n) n Gy) (7-29) 
式 中 ,xz=0,1,2,…,M-1liy=0,1,2,…,V-1;ig (xy) 也 为 周期 函数 ,其 周期 与 FUx,y) 
和 (x,y) 完 全 相同 。 
上 式 也 可 以 用 矩阵 表示 为 
g-Hf*n (7-30) 


式 中 ,g、f.n WHITES M x N 维 , 它 把 各 行 顺 时 针 转 90” 3E II, SIE M x N 维 列 
向 量 ; 五 为 MN x MN 的 矩阵 


H, Hy. Hy- H, 
H, H, Hy, ce Hh 
H=| H, H, H, “e H (7-31) 
Hy, Hy- Hasc se H, 
式 中 ,每 个 分 块 H, 都 是 一 个 NxW 的 矩阵 ,是 由 延 拓 函数 h(x,y) 的 j 行 构成 的 , 即 
MAGON BN =1) AQUNSA) con hd) 
h.(j,1) A0) EGN-1) 9 &G.2) 
H,-| h.(j,2) h.(j,1) h. (j,0) vs eaaa) (7-32) 
RAIN =I) MIN =2) A,U,N-3) e AQ.0) 


RJ UL, H, 是 一 个 循环 矩阵 ,而 H EARE E, 
上 述 离 散 退 化 模型 是 在 线性 空间 不 变 的 前 提 下 推出 的 。 目 的 是 在 给 定 了 g(x,y) ,并 且 知 
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道 退 化 系统 的 冲 激 响 应 (x,y) 和 加 性 噪声 n (x y) 的 情况 下 ,估计 出 理想 的 原始 图 像 Kx,y)。 
但 是 ,要 想 从 式 (7-30) 直接 求解 得 f(x,y) ,对 于 实际 大 小 的 图 像 来 说 ,这 一 过 程 是 十 分 繁琐 
的 。 例 如 , 若 M=N=5l12 if, H BEER ANA: MN x MN = (512)! x (512)? 2 262144 x 
262144 ,求解 /需要 解 262144 个 联 立 线性 方程 组 ,计算 量 之 大 难以 想象 ,因此 需要 研究 一 些 算 
法 以 便 简化 复原 运算 的 过 程 ,利用 石 的 循环 性 质 , 使 简化 运算 得 以 实现 。 

根据 有 关 的 数学 知识 ,由 于 五 是 分 块 循环 矩阵 , 则 五 可 对 角 化 , 即 


H= WDW-! (7-33) 
W 为 一 变换 阵 ,大 小 为 MN x MN 维和 矩阵 E HM? 个 大 小 为 xM 的 子 块 的 部 分 组 成 
w(0,0) w(0,1) E w(0,M -1) 
bis (1,0) ELN E pmo usd 
w(M-1,0) w(M-1,1) = w(M-1,M-1) 
其 中 ， 
w(i,m) = exp [j Fim |, (7-35) 
式 中 ,im =0,1,2,…,MNM-LiwN 为 WxN 的 矩阵 ,其 元 素 为 
ARA) = exp |j 28a] (7-36) 


AU kn 20,1,2,:-,N- 1, 
实际 上 ,对 任意 形 如 五 的 分 块 循环 矩阵 ,W 都 可 使 其 对 角 化 。D 是 对 角 阵 ,其 对 角 元 素 与 
h.(x,y) 的 傅立叶 变换 有 关 , 即 如 果 


ER E ss - pma ( UX WY ? 
| Bug € (7-37) 


则 DD 的 MxNN 个 对 角 线 元 素 按 下 面 的 形式 给 出 ,第 一 组 NN 个 元 素 为 H(0,0),H(0,1)， 
…, 有 (0,N -1) ;第 二 组 为 H(1,0),H(1,1),…,H(1,N-1); 以 此 类 推 ,最 后 的 NN 个 对 角 线 元 
素 为 HCM-1,0) ,H(M -1,1),…,H(M -1,N -1); 由 上 述 元 素 组 成 的 整个 矩阵 再 乘 以 MN 
得 到 万 , 即 有 


wn [4] mod | ix 


D(k,i) = (7-38) 





0 ixk 
式 中 , [E RRRA tdi Acts modi 是 以 N 除 以 大 所 得 到 的 余数 。 从 而 退化 模 
型 可 写成 


g=Hf+n=WDW-!f+n (7-39) 
W-'gzdW f-W-^n (7-40) 
可 以 证 明 
W-!'g = Vec[ G(u,v) | (7-41) 
W-'f = Vec[ F(u,v)] (7-42) 
W-'n - Vec[ N(u,v) | (7-43) 


— 253 二 


图 像 处 理 与 机 器 视觉 

式 中 ,Vec[  ] 是 将 矩阵 拉 伸 为 向 量 的 算 子 ,例如 

] 

| 2 

Vec £ 

3 4 3 

4 
G(u,v) .F(u,v) 和 NN(w,v) 分 别 是 g(x,y) xy) 和 mxz,y) 的 二 维 傅立叶 变换 。 于 是 有 
G(u,v)  MNH(u,v) F(u,v) * N(u,v) (7-44) 


这 样 就 将 求 f(x%,y) 的 过 程 转换 为 求解 F(u,v) 的 过 程 ,简化 了 计算 ,同时 式 (7-44) 也 是 进 
行 图 像 复原 的 基础 。 


7.3 图 像 复 原 的 方法 


图 像 复原 的 方法 很 多 ,这 里 我 们 主要 介绍 反 向 滤波 复原 法 和 维 纳 滤 波 复原 法 。 

7.3.1 反 向 滤波 复原 法 

反 向 滤波 法 又 叫 逆 滤波 复原 法 ,其 主要 过 程 是 :首先 将 要 初始 图 像 从 空间 域 变换 到 傅立叶 
频率 域 当 中 ,然后 对 得 到 的 图 像 进行 反 向 滤波 ,再 由 频 域 转换 回 到 空间 域 , 便 可 得 到 想 要 的 复 
原 图 像 。 如 果 退 化 图 像 为 g(x,y) ,原始 图 像 为 f(x,y) ,在 不 考虑 噪声 的 情况 下 ,其 退化 模型 表 
示 为 : 





Gy) = [ [f GB) h(x - a,y - B) dadg (7-45) 
由 傅立叶 变换 卷 积 定理 可 知 : 
G(u,v) H(u,v)F(u,v) (7-46) 


P Gu, v) H(u,v) ECG) 分 别 是 退化 图 像 g(x,y)、 点 扩散 函数 h(x,y)、 原 始 图 像 
有 凡 x,y) 的 传 立 叶 变换 。 进 一 步 有 


F(u v) re (7-47) 


从 以 上 可 知 如 果 已 知 退化 图 像 的 傅立叶 变换 和 “滤波 ”传递 函数 ,就 可 以 求 得 原始 图 像 的 
傅立叶 变换 ,经 傅立叶 反 变 换 就 可 以 求 得 原始 图 像 , 这 里 G(u,v) 除 以 H(u,v) 起 到 了 反 向 滤波 
的 作用 。 在 有 噪声 的 情况 下 , 反 向 滤波 原理 可 以 写 为 : 

G(u,v)  H(u,v)F(u,v) * N(u,v) (7-48) 

2 GCu,v) | .N(u v) 

H(u,v) H(u,v) 
式 中 ,N(w,v) 为 噪声 n(x,y) 的 傅立叶 变换 。 

对 于 离散 的 退化 模型 矩阵 表示 形式 :8 =Hf+n, 当 对 n 的 统计 特性 并 不 了 解 时 ,希望 能 找 


到 一 个 f, 使 及 能 在 最 小 二 乘 意义 上 来 说 近似 于 g, 即 希望 找到 一 个 f 使 











F(u,v) (7-49) 


JO) = lg - Bfl = ln]? (7-50) 


Jio. XX [In]? 227n,llg -HF| 2 (g - HD) (g - Bf. 
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这 实际 上 是 求 J() 的 最 小 值 问题 。 由 于 除了 要 求 7( 广 为 最 小 外 ,不 受 任何 其 他 条 件 约 
束 ,所 以 又 称 为 非 约束 复原 。 


将 鼠 / 对 / 求 导 ,并 令 其 等 于 零 , 则 有 


IP) < 2H (g -HY =0 (1-51) 
of 
H'H f - H'g (7-52) 
f-GH)^H'g (1-53) 
E M =N WERF BEH EAE, TEA 
Î=H(H')"H"9=H~'g (7-54) 
由 于 五 为 分 块 循环 矩阵 ,上 且 有 五 = WDW-',D 为 对 角 和 矩阵 , 则 
f-(WDW-)^g -WD^'W-'g (7-55) 
W-'f-D^W-g (7-56) 
由 WW 下 的 性 质 ,可 得 到 
^ 3L 6(u,v) E 
F(u,v) ^ M'H(u,v) (7-57) 


式 (7-57) 说 明 如 果 知 道 了 g(x,y) 和 有 h(x,y) ,也 就 知道 了 G(u,v) FI H(u,v) ,进而 可 求 的 


F(u ,v) ,再 经 傅立叶 反 变 换 就 能 求 出 F(x,y) 。 式 (7-54) 就 是 离散 退化 模型 下 的 反 向 滤波 法 。 
利用 式 (7-57) 进 行 复原 时 , 若 H(u,v) 在 w 平面 上 的 某 些 区 域 等 于 0 或 变 得 非常 小 ,那么 


复原 就 会 出 现 病态 性 质 , 即 F(u,v) 在 H(u,v) 的 零点 附近 变化 剧烈 ,严重 偏离 实际 值 。 若 还 存 
在 噪声 , 则 后 果 更 加 严重 。 因 为 


h _Cuw) |, MF(u,v) * N(u,v) _ Nuw) 
Pe ex Cus) M H(u,v) A ETT ES 
一 般 情 况 下 有 H(u,v) 的 幅度 随 着 离 uw 平面 原点 的 距离 增加 而 迅速 下 降 , 但 N(x,y) 幅度 


的 变化 是 比较 平缓 的 ,在 远离 w 平面 的 原点 时 , 宫 训 的 值 就 会 变 得 很 大 ， 甚至 可 能 出 现 


F(u,v) «IPRC EE UB HET RIS F(u,v) ,使 复原 出 来 的 图 像 面目 全 非 。 


解决 病态 问题 的 唯一 方法 就 是 避 开 有 (u,v) 的 零点 及 小 数值 的 H (u,v) 进行 修改 , 即 仔细 
设置 有 (wu,v) =0 的 频谱 点 附近 及 "(u,v) 的 值 ,然后 在 原点 的 有 限 的 邻 域内 进行 ,以 避免 小 数 
值 的 及 (u,v) ,也 即 选 择 一 个 低 通 滤波 器 。 


(7-58) 


1 u +v SD, 
H, (u,v) = (7-59) 
0 Vu +o >D, 


D, 的 选择 应 将 H (u,v) 的 零点 排除 在 此 邻 域 之 外 ,并 进行 如 下 的 反 向 滤波 复原 : 
G(u,v) Hu (u,v) 


Puo) 一 M^H(u ,v) 


(7-60) 


AS em 
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为 避免 振 铃 影响 ,还 可 以 选择 平滑 的 低 通 滤波 器 如 巴特 沃 思 滤 波 器 等 代 蔡 H, (u,v) 。 
逆 滤 波 算法 运算 效率 相对 而 言 比较 高 ,并且 简 单 易 实现 ,复原 后 得 到 的 图 像 也 比较 清晰 ， 
不 足 之 处 是 会 出 现 明显 的 振 铃 效应 。 通 过 研究 我 们 得 到 一 种 解决 的 方法 ,对 赣 滤 波 复原 后 的 
图 像 进行 平滑 处 理 ,从 复原 图 像 质量 以 及 客观 评价 标准 来 看 ,图 像 平滑 能 够 有 效 地 减弱 振 铃 效 
应 ,更 好 地 改善 图 像 质量 。 
FER S 维 纳 滤波 复原 法 
维 纳 ( Wiener) 滤波 可 以 归于 反 卷 积 (或 反 转 滤波 ) 算 法 一 类 , 它 是 由 Wiener 首先 提出 的 ， 
应 用 于 一 维 信 和 号 ,并 取得 很 好 的 效果 。 以 后 算法 又 被 引入 二 维 信号 处 理 ,也 取得 相当 满意 的 效 
果 , 尤 其 在 图 像 复原 领域 ,由 于 维 纳 滤波 器 的 复原 效果 良好 ,计算 量 较 低 ,并 且 抗 噪 性 能 优良 ， 
因而 在 图 像 复原 领域 得 到 了 广泛 的 应 用 ,并 不 断 得 到 改进 发 展 ,许多 高 效 的 复原 算法 都 是 以 此 
为 基础 形成 的 。 
维 纳 滤波 方法 也 就 是 最 小 二 乘 滤波 。 它 是 使 得 原始 图 像 f(x,y) IRERE RUR, y) 
之 间 的 均 方 差 最 小 的 复原 方法 。 
设 原 始 图 像 . 退 化 图 像 和 噪声 图 像 为 Kx,y) g(x,y) n(x,y) ,关系 如 下 : 
g(x,y) = | hC -a,y Bf Co B) dadB +n(x,y) (7-61) 
式 中 ,f(x,y) g(x,y) n(x,y) 都 是 随机 场 ,并 假定 噪声 的 统计 特性 已 知 。 因 此 ,给 定 了 
g(x,y) ,仍然 不 能 精确 求解 f(x,y) ,只 能 找 出 f(x,y) 的 一 个 估计 值 f(x,y) ,使 得 均 方 误差 : 
e =E|[f(x,y) -f(x,y) ]’| (7-62) 
最 小 。 其 中 /(x,y) 是 给 定 g(x,y) 对 f(x,y) 的 最 小 二 乘 方 估计 。 
假定 f(x,y) 是 g(x,y) 灰 度 级 的 线性 函数 , 则 有 : 


foy) = mls,y,a,B) g(a,B) dadB (7-63) 
如 果 随 机 场 均匀 ,权重 m(x,y,a,B) 只 与 (zx -a,y -B) 有 关 , 式 (7-63) 可 以 写成 ， 
Jy) = | mla -ay -B)g(a,B)dadB (7-64) 
均 方 误差 可 以 写成 ， 
e = Ef [ruo - | ma -ay - Co B)dod8] } (T-65) 


所 以 ,最 小 二 乘 方 估计 的 目的 就 是 寻找 点 扩散 函数 m (xy) ,使 得 均 方 误差 最 小 。 可 以 证 
明 对 于 xy 平面 上 的 所 有 位 置 向 量 (x,y) 和 (a,B) 都 满足 式 (7-66) 的 要 求 . 


Ef [s - |m - ny -B)e(a,B)dadB]xe(oa',B)}=0 (7-66) 
可 将 式 (7-66) 改 写 为 : 
[| mi -a,y - B) ElgCa B)g(a' B) |dadB = Elflx,y)e(a',B')l (7-67) 
设 随机 场 均匀 ,并 且 令 ， 
E|gla, B)gCa' B^) | SR, Co B A'B) SR, (a ca B - B') 
Ae 
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E|g(x,y)g(a',B') | 3 Ry (x,y,a',B') 2 Ru(x -a',y - B') 
代入 式 (7-67) 得 ， 
[ms -a,y -BRa(a -a',B -B')dadB = R(x -a',y-B') (7-68) 
对 式 (7-68 ) 的 变量 进行 蔡 换 ,并 对 两 边 进行 傅立叶 变换 ,可 得 ， 
M(u,v)S,(u,v) 2 SL(u,v) (7-69) 
其 中 ,S, (u,v) 是 退化 图 像 g(x,y) 的 谱 密 度 ;Si (Qu, v) 是 退化 图 像 与 原始 图 像 的 互 谱 密 
度 。 如 果 图 像 f(x,y) 与 噪声 Ge Wt oe 
Elf(x,y)n(x,y)] S Elf(x,y) | Eln(x,y)] = (7-70) 
这 种 情况 下 的 滤波 器 的 形式 可 以 通过 如 下 的 推导 得 出 。 II JEF: 
Rus, y,a',B') = R,(x -a'y - B") 
z Elf(x,y)gCa' ,B')] 


= [ito - a' 48 - B) EUG.) (a,B) | dadg 


= [ito - a' 8 - B) R«(x - asy - B) dad (721) 
3X 07-271) 经 过 一 系列 的 变量 替换 后 可 得 : 
Ri(x,y) = [ht - x,B -7)Rr(a,B)dadB (1-2) 
对 等 式 两 边 进行 傅立叶 变换 有 : 
Su (u,v) 2 H' (u,v) S,(u,v) (7-73) 
又 因为 : 
S Cuv) 2 Sq(u,v) | H(u,v) |? * S, (u,v) (7-74) 
联 立 式 (7-69) 式 (7-73 ) id -74) 可 得 ， 
M(u,v) = LHQu o) Ê (7-75) 


2 v) |H(u,v) | * [S,, (u,v)/Sq(u v) ] 
MS (uv) 20 时 ,就 是 理想 的 滤波 器 。 通 常 认为 品 声 是 白 噪 声 , 即 $S (u,v) = 常数 。 如 
果 有 关 的 随机 过 程 的 统计 特性 都 不 知道 ,可 以 用 下 式 近似 的 表示 滤波 吉 ， 
1 | H(u,v) |? 
~ H(u,v) |H(u,v) | +r 
维 纳 滤 波 因为 效果 较 好 而 得 到 广泛 应 用 ， 并 且 也 受到 更 为 深入 的 研究 。 以 维 纳 滤 波 为 基 
又 出 现 了 很 多 的 改进 算法 ,以 适应 不 同 的 要 求 。 维 纳 滤波 通常 适用 于 线性 的 空间 不 变 模 糊 
es 并 且 噪 声 是 加 性 非 相 关 的 情况 。Andrews 和 Hunt 已 经 证 明 , 在 轻微 的 模糊 和 适量 噪声 
影响 下 , 维 纳 滤 波 并 不 能 达到 人 有 眼 所 要 求 的 最 佳 效果 。 


7.3.3 图像 复原 的 实现 


在 本 节 中 将 结合 上 述 的 理论 ,分 别 给 出 具体 的 实现 方法 ,设计 了 基于 Matlab 平台 和 
DM642 DSP 系统 的 C 语言 代码 ,可 以 帮助 读者 深入 了 图 像 复原 特点 ,掌握 其 实现 过 程 。 

1. Matlab 仿真 实现 

(1) 逆 向 滤波 的 M 文件 源 代码 及 仿真 结果 


M(u,v) = 





(7-76) 
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I = imread( 'G; Vcargray512. bmp!) ; 
figure(1) ; 

imshow( I) ; 

title( 原始 图 像 ) ; 

LEN = 31; 

THETA = 11; 

PSF = fspecial( motion , LEN , THETA ) ; 
blurred = imfilter( I, PSF , 'circular' ,'conv') ; 
wnrl = deconvwnr( blurred , fspecial'motion' ,LEN ,2 * THETA) ) ; 
noise = 0.1 * randn( size( I) ) ; 

blurredNoisy = imadd( blurred , im2uint8 ( noise) ) ; 

figure(2) ; 

imshow ( blurredNoisy ) ; 

title( 加 入 运动 模糊 和 噪声 的 图 像 ') ; 

NSR = sum(noise( :). ^2) /sum( im2double( I( : ) ). ^2) ; 

wnr = deconvwnr( blurredNoisy , PSF, NSR) ; 
figure(3) ; 

imshow ( wnr) ; 

title( 'Restored with NSR') ; 

逆向 滤波 的 仿真 结果 图 7-3 所 示 。 










e 


a) 原始 图 像 





(0 g 逆 向 波 波 处 理 后 图 像 
图 73， 道 向 滤波 仿真 结果 
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(2) 维 纳 滤波 的 M 文件 源 代码 及 仿真 结 

I = im2double( imread( 'G ; \cargray512. bmp') ) ; 
figure(1) ; 

imshow( I) ; 

title(' 原始 图 像 ) ; 

LEN = 21; 

THETA = 11; 

PSF = fspecial('motion', LEN, THETA) ; 
blurred = imfilter( I, PSF, 'conv', 'circular') ; 
figure(2) ; 

imshow ( blurred ) 

title(' 加 入 运动 模糊 的 图 像 ') ; 

noise mean = 0; 

noise var = 0.0001; 

blurred, noisy = imnoise( blurred, 'gaussian', noise, mean, noise var); 
figure(3) ; 

imshow( blurred, noisy ) ; 

title ( ' 加 入 运动 模糊 和 高 斯 噪声 的 图 像 '); 


estimated_nsr = noise, var / var(I(:)); 


wnr = deconvwnr( blurred noisy, PSF, estimated, nsr) ; 
figure(4) ; 

imshow ( wnr) ; 

title(' 维 纳 滤波 后 的 图 像 ') ; 

维 纳 滤波 仿真 结果 图 7-4 所 示 。 





图 7-4 


b) 加 入 运动 模糊 后 的 图 像 











IRER 








=R 
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c) 加 入 运动 模糊 和 高 斯 噪声 后 的 图 像 d) 维 纳 滤波 后 的 图 像 
图 7-4” 维 纳 滤波 仿真 结果 
2. 逆向 滤波 的 DM642 DSP 系统 的 算法 实现 
本 文 基于 DM642 DSP 系统 进行 相应 的 C 语言 程序 设计 ,由 于 代码 较 长 本 书 仅 以 逆向 滤波 
为 例 ,进行 图 像 复原 DSP 代码 设计 。 至 于 维 纳 滤波 ,读者 可 以 仿照 逆向 滤波 ,进行 自行 设计 。 
(DDM642 的 程序 源 代码 
#include < stdio. h > 
#include < stdlib. h > 
#include < math. h > 
#define pi 3.1415 
#define Width 256 
#define Height 256 
void ReadImage( char * cFileName) ; 
void bmpDataPart( FILE * fpbmp) ; 
void inversefilter( ) ; 
void fft( ) ; 
void ifft( ) ; 
void hfft( ) ; 
*pragma DATA. SECTION( input, e my. sect) 
sipragma DATA, SECTION( fdout , ". my. sect") 
#pragma DATA, SECTION( tdout , "'. my. sect" ) 
#pragma DATA, SECTION( hfd , br my. sect" ) 
#pragma DATA, SECTION( fd, re, ". my. sect") 
#pragma DATA, SECTION( fd. im, ". my. sect") 
Zpragma DATA, SECTION( td, re, "". my. sect") 
#pragma DATA, SECTION( td, im, "". my, sect") 
#pragma DATA, SECTION ( hd. re, "'. my, sect") 
— 260 — 
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#pragma DATA. SECTION( hd, im, W my_sect" ) 
#pragma DATA_SECTION(wxl_re,，. my, sect") 
#pragma DATA_SECTION( wxl_im,!'!. my, sect") 
#pragma DATA, SECTION ( wx2. re, ". my, sect") 
#pragma DATA, SECTION( wx2 im, ". my. sect") 
#pragma DATA. SECTION ( wco, re, i my, sect" ) 
#pragma DATA, SECTION ( wco, im, ". my, sect") 
#pragma DATA, SECTION( hx1. re, as my. sect!) 
Zpragma DATA, SECTION( hx1l, im, ". my. sect") 
#pragma DATA, SECTION( hx2, re, "". my. sect") 
#pragma DATA, SECTION( hx2, im, "'. my. sect") 
Spragma DATA, SECTION ( hco. re, ". my, sect") 
#pragma DATA. SECTION( hco. im, l! my. sect") 
unsigned char input[ Height | [ Width | ; 

unsigned char fdout[ Height ] [ Width | ; 

unsigned char tdout[ Height | | Width | ; 

unsigned char hfd[ Height ] [ Width | ; 

double fd, re[ Height ] | Width ] ; 

double fd. im[ Height | | Width | ; 

double td, re[ Height | [ Width | ; 

double td, im[ Height | [ Width | ; 

double hd, re[ Height ] [ Width | ; 

double hd, im| Height] [ Width ] ; 

double wxl_rel Width | ; 
double wx1, im[ Width | ; 
double wx2. re| Width | ; 
double wx2_im[ Width | ; 
double wco, re| Width | ; 
double wco, im[ Width] ; 
double hx1, re[ Height] ; 
double hx1, im[ Height | ; 
double hx2, re[ Height] ; 
double hx2, im[ Height | ; 
double hco, re Height] ; 
double hco, im[ Height] ; 























void main( ) 


| 
/* 图 像 */ 
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ReadImage( "'G: \lenatuihua256. bmp) ; 
inversefilter( ) ; i 
while (1); 
| 
void ReadImage( char * cFileName) 
| 
FILE * fp; 
if ( fp 2 fopen( cFileName, "rb" ) ) 
| 
bmpDataPart( fp) ; 
fclose( fp) ; 


| 
void bmpDataPart(FILE * fpbmp) 
| 
int i, j 20; 
unsigned char * pix = NULL; 
fseek ( fpbmp, 1078L, SEEK SET) ; 
pix = ( unsigned char * ) malloc ( Width) ; 
for(j 20;j < Height;j + +) 
| 
fread ( pix, 1, Width , fpbmp) ; 
for(120;i < Width;i- 4) 
| 
input[ Height -1 -j][i] —-pix[i]; 


| 
void inversefilter( ) 
| 
int i,j; 
double a,b,c,d; 
fft) ; 
hfft( ) ; 
for(i =0;i < Height;i + +) 
| 
for(j =0;j < Width;j + +) 
| 
— 262 — 


第 7 章 图 像 复 原 


a=f{d_re[lil][j]; 

b 2fd im[i][j]; 

c 2 hd re[ i][ j]; 

d 2 hd im[i][j]; 

if(c*c+d*d > 0.001) 

| 
fd_re[i][j] =(ax*c + b*d)/(c*c + d*d); 
fd im[i]l[j] =(bxc - a*d)/(c*e + d*d); 


| 
ifft( ) ; 

| 

void fft( ) 

| 
int ijj; 
int w,h; 
int wp,hp; 
int a,b,c; 
int p, bfsize ; 
double angle; 
double dtemp ; 
double x, re,x. im; 
double ta ,tb ,tc , td ; 
unsigned char temp; 
wzl; 
hzl; 
wp 20; 
hp 20; 
while(2 * w < 
| 


w* =2; 


Width ) 


wp t; 
| 
while(2 *h < = Height) 
| 
h * =2; 
hp+ +; 
— 263 = 
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| 
for(i=0;i<h;i+ +)X/ 沿 x 轴 进行 快速 傅立叶 变换 
| 

for(j =0;j <w;j+ +) 

] 


temp =input[ i] [j]; 
wxl_re[j] = ( double) ( temp) ; 
wxl, im[ j] 20; 

| 

for(j 20;j < (Width/2) ;j * +) 

| 
angle = —j * pi * 2/Width; 
wco. re[ j] = cos( angle) ; 


wco. im[ j] = sin( angle) ; 


for(az0;a«wp;a- +) 
| 


for(b=0;b<(1< <a);b+ +) 
| 
bfsize Z1 < < (wp -a); 
for(c 20;c < ( bfsize/2) ;c + +) 
| 
p =b * bfsize; 
wx2 re[ c +p] 2wxl re[ c +p] + wxl re[ c +p * bfsize/2] ; 
wx2 im[c*p] 2wxl im[c*p] + wxl, im[c +p + bfsize/2] ; 
ta 2wxl re[c +p] - wxl, re[ c +p * bfsize/2]; 
tb =wxl_im[c +p] - wxl_im[c p + bfsize/2]; 
tc 2 wco re[c * (1< <a)]; 
td 2wco im[c*(1« «a) ]; 
wx2 re| c +p + bfsize/2] =ta * te — tb * td; 
wx2 im[e + p + bfsize/2] =ta *td + tb tc; 


| 
for(c=0;c < Width;c + +) 
| 
x_re =wxl_re[ c]; 
x_im =wxl_im[|c]; 
wxl_re| c] 2 wx2 re[ c] ; 
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wxl.im[c] 2wx2 im[c]; 
wx2 re[c] -x re; 


wx2 im[c)] 2x im; 


| 
for(b =0;b<Width;b+ +) 
| 
p=0; 
for(c=0;c <wp;c+ +) 
| 
if(b & (1« «e)) 
| 
p+=l1<<(wp-c-1l); 
| 
| 
fd_re[i][b] 2 wxl re[ p]; 
fd im[i][b] 2wxl. im[ p]; 
| 
| 
for(j =0;j «wij + + ) 人 沿 y 轴 进行 快速 傅立叶 变换 
| 
for(i=0;i<h;i+ +) 
| 
hxl_re[i] =fd_re[i][j]; 
hxl im[i) =fd_im[i][j]; 
| 
for(120;i1«(Heigh/2) ;i * +) 
| 
angle = — i * pi * 2/Height; 
hco, re[ i] 2 cos( angle) ; 
hco, im[i] = sin(angle) ; 
| 
for(a=0;a<hp;a+ +) 


| 
for(b=0;b<(1< <a);b+ +) 
| 
bfsize =1 < «(hp-a); 
for(c 20;c «(bfsize/2) ;c + +) 
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| 
p =b * bfsize; 
hx2 re[ c +p] =hxl_relc+p] + hxl_re[c +p + bfsize/2]; 
hx2_im[c +p] =hxl_im[c +p] + hxl_im[c +p + bfsize/2]; 
ta=hxl_re[c+p] — hxl_re[ e +p + bfsize/2 | ; 
tb =hxl_im[c +p] - hxl_im[c +p + bfsize/2] ; 
te =hco_re[c* (1< <a)]; 
td =hco_im[ c * (1< <a)]; 
hx2 re[ c +p + bfsize/2] =ta * te — tb * td; 
hx2 im|[ c +p + bfsize/2] =ta*td + tb * tc; 


| 


for( c =0;c < Height;c + +) 
| 
x re 2 hxl. re[ c]; 
x im -hxl im[c]; 
hxl re[c] 2 hx2 re[ c]; 
hxl im[c] -hx2 im| c]; 
hx2 re[ c] 2x re; 
hx2_im[ c] 2x im; 


L 
Í 


for(b =0;b < Height;b + + ) 
| 

p=0; 

for(c=0;c <hp;c+ +) 


| 
1 


if(b & (1« «c)) 
| 
p*zl««(hp-c-1); 


| 
fd re[ b][j] 2hxl. re[ p]; 
fd im[b][j] 2hxl, im[p]; 


l 
Í 


for(i =0;i < Height;i + +) 
| 
— 266 — 
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for(j =0;j<Width;j+ +) 
| 
dtemp = sqrt(fd_re[i][j] *fd re[i][j] + fd im[i][j] *fd im[i][j])/100; 
if( dtemp » 255) 
| 
dtemp =255 ; 
| 
fdout[ i] [j] = (unsigned char) ( dtemp) ; 
| 


| 
void ifft( ) 
| 
Int. 1,]5 
int w, h; 
int wp,hp; 
int a,b,c; 
int p, bfsize ; 
double angle; 
double dtemp; 
double x, re,x. im; 
double ta , tb ,tc , td ; 
wal: 
hzl; 
wp 20; 
hp 20; 
while(2 * w < = Width) 
| 
W* =2; 
WDF T; 
| 
while(2 * h < = Height) 
| 
h* =2; 
hp+ +; 


| 
I 


for(i=0;i<h;i+ + )// 沿 x 轴 进 行 快速 傅立叶 变换 
| 
— 261 — 
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for(j =0;j <w;j + +) 
| wxl re[ j] 2 fd re[i][j]; 
wxl im[j] =fd_im[i][j]; 
for(j =0;j <w;j+ +) 


wxl_im[j] = -wxl. im[j]; 


for( j =0;j < ( Width/2) ;j 十 +) 





angle = —j * pi * 2/Width; 
wco re[ j] = cos( angle) ; 
wco im[ j] = sin( angle ); 
| 
for(a=0;a <wp;a + +) 
| 
for(b =0;b<(1< <a);b+ +) 
| 
bfsize 21 < < (wp -a); 
for(c 20;c < ( bfsize/2) ;c + +) 
| 
p =b * bfsize; 
wx2_re[c +p] =wxl_re[c +p] + wxl_re[c +p + bfsize/2] ; 
wx2_im[c +p] =wxl_im[c +p] + wxl_im[c +p + bfsize/2] ; 
ta=wxl_re[c+p] - wxl_re[ c +p +pbfsize/2]; 
tb =wxl_im[c +p] - wxl_im[c +p + bfsize/2] ; 
tc 2 wco re[c * (1« <a)]; 
td 2wco im[c* (1 « «a) ]; 
wx2 re[ c + p + bfsize/2] =ta * tc. — tb * td; 
wx2 im[c +p + bfsize/2] =ta *td + tb * tc; 


| 
for(c 20;c < Width;c + +) 
| 
x re 2 wx] re[ c]; 
x in 2 wxl. im[c]; 
wxl re[ c] 2 wx2. re[ c]; 
— 268 — 


for(b 20;b < Width;b + +) 
| 
p=0; 
for(c=0;c <wp;c + +) 
| 
if(b C1 «c)) 
| 
p+=1< <(wp-c-l1); 
| 
| 
td_re[i][b] =wxl_re[p]; 
td. im[i][b] =wxl_im[ p]; 
| 
for(j 20;j < Width;j + +) 
| 
td_re[i][j] =td_re[i][j]/Width; 
td im[i][j] = -td_im[i][j]/Width; 
| 
| 
for( j =0;j<w;j+ + )// ih y 轴 进 行 快速 傅立叶 变换 
| 
for(i=0;i<h;i+ +) 
| 
hxl_re[i] =td_re[i][j]; 
hxl_im[i] 2td im[i][j]; 


for(i20;i«h;i- +) 
hxl im[i] = -hxl im[i]; 


for(i =0;i < (Height/2) ;i + +) 





angle = 一 i * pi * 2/ Height; 
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iiia i Lak 


hco. re[ i] = cos( angle) ; 
hco, im[ i] = sin(angle) ; 
| 
for(a=0;a <hp;a+ +) 
| 
for(b =0;b<(1< <a);b+ +) 
| 
bfsize 21 < «(hp-a); 
for(c 20;c < ( bfsize/2) ;c + +) 
| 
p =b * bfsize; 
hx2 re[ c +p] =hxl_re[c +p] + hxl_re[c +p + bfsize/2]; 
hx2_im[c +p] =hxl_im[ce +p] + hxl_im[c +p + bfsize/2]; 
ta =hxl_re[c+p] - hxl_re[c +p +pbfsize/2]; 
tb =hxl_im[c +p] - hxl_im[c +p + bfsize/2] ; 
tc =hco_rel cx (1< <a)]; 
td =hco_im[ c * (1< «a) ); 
hx2_re[ c +p + bfsize/2] =ta * te - tb * td; 
hx2_im[ c + p + bfsize/2] =ta * td + tb * tc; 


| 
for(c 20;c «Height;c + +) 
| 
x re =hxl_re[c]; 
x im z hxl. im[c]; 
hxl_rel c] 2 hx2. re[ c]; 
hxl_im[ c] 2 hx2 im[c]; 
hx2 re[c] 2x re; 
hx2 im[c] 2x im; 


| 
for( b =0;b < Height;b + +) 
| 
p=0; 
for(c =0;c <hp;c + +) 
| 
if(b & (1« «c)) 
| 
—240:—5 


p+=l1<<(hp-c-=-l); 
| 
| 
td re[ b][j] =hxl_rel p]; 
td. im[b][j] 2 hxl im[p]; 
| 
fot( 1 S041 < Holghtsi t) 
| 
td. re[ 1] [j] 2 td re[ i] [ j ]"Height; 
td im[i][j] = -td im[i][ j |/Height; 
| 
| 
for(i =0;i < Height;i + +) 
| 
for(j =0;j<Width;j+ +) 
| 
dtemp 7 td. re[ i][ j]; 
if( dtemp » 255) 
| 
dtemp =255; 
| 
tdout[ i][j] = (unsigned char) ( dtemp) ; 
| 


l 
i 


void hfft( ) 

| 
int i,j; 
int w,h; 
int wp,hp; 
int a,b,c; 
int p,bfsize; 
double angle; 
double dtemp ; 
double x, re,x. im; 
double ta ,tb tc ,td ; 
w zl; 


h=1; 
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wp 20; 
hp 20; 
while(2* w < = Width) 
| 
W =2; 
wp+ +; 
| 
while(2*h < = Height) 
| 
hs 22; 
hp+ +; 
| 
for(i=0;i<h;i+ + )// 沿 x 轴 进 行 快速 任 立 叶 变 换 
| 
for(j =0;j <w;j + +) 


| 
| 


if(i«2 && j <2) // 构 造 点 扩展 函数 
| 

wxl re[j] 20.04; 

wxl.im[j] 20; 


for(j =0;j < (Width/2) ;j * +) 
| 
angle = -j * pi *2/Width; 
wco_re[ j] = cos( angle) ; 
wco, im[ j] = sin( angle) ; 
| 
for(a=0;a <wp;a+ +) 
| 
for(b=0;b<(1 < <a);b+ +) 
| 
bfsize 21 < < (wp -a); 
— p se 
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for(c 20;c < ( bfsize/2) ;c + +) 
| 
p =b * bfsize; 
wx2 re[ c +p] 2wxl re[c +p] + wxl_re[c +p + bfsize/2 | ; 
wx2_im[c +p] 2wxl im[c*p] + wxl im[c +p + bfsize/2] ; 
ta Zwxl re[ c * p] - wxl re[ c +p + bfsize/2]; 
tb =wxl_im[c +p] - wxl im[c +p + bfsize/2]; 
tc 2 wco re[c * (1 « «a)]; 
td 2 wco im[e* (1< «a)]; 
wx2 re[ c +p + bfsize/2] =ta *te — tb * td; 
wx2 im[ c +p + bfsize/2] =ta * td tb * tc; 


| 
for(c 20;c < Width;c + +) 
| 
x re - wxl re( c] ; 
x im 2 wxl, im[ c]; 
wxl. re[ c] 2 wx2. re[ c] ; 
wxl im[c|] 2 wx2 im[c]; 
wx2 re[c] 2x re; 
wx2 im[c] 2x im; 


j 
for(b=0;b < Width;b + + ) 
| 
p=0; 
for(c=0;c <wp;c+ +) 
| 
if(b & (1« «e)) 
| 
p*-1««(wp-c-1); 


| 


hd re[ i][b] =wxl_re[p]; 
hd_im[i][b] =wxl_im[p]; 


— Ha = 
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for(j =0;j « wij + +)// 沿 y 轴 进行 快速 傅立叶 变换 
| 
for(iz0;i«h;i- +) 
| 
hxl_re[ij =hd_re[i][j]; 
hxl, im[i] 2hd im[i][j]; 
| 
for(120;i«(Height/2) ;i * +) 
| 
angle = —i* pi * 2/Height; 
hco_re[ i] 2 cos( angle) ; 
hco, im[i] = sin(angle) ; 
| 
for(az0;a«hp;a- +) 
| 
for(bz0;b«(l1« <a);b+ +) 
| 
bfsize =1 < < (hp -a); 
for(c=0;c < (bfsize/2);c+ +) 
| 
p =b * bfsize; 
hx2 re[ c +p] =hxl_re[c+p] + hxl_re[c +p+bfsize/2]; 
hx2_im[c +p] =hxl_imlc+p] + hxl_im[c +p+bfsize/2]; 
ta=hxl_relc+p] - hxl_re[ c +p +pbfsize/2]; 
tb =hxl_im[c +p] - hxl_im[e +p + bfsize/2]; 
te =hco_re[c * (1< <a)]; 
td =hco_im[ c * (1 «€ <a)]; 
hx2 re[ c +p + bfsize/2] =ta*tc — tb * td; 
hx2 im[c +p + bfsize/2] =ta * td + tb *tc; 
| 
for(c 20;c < Height;c + +) 
| 
x_re=hxl_rel c]; 
x_im =hxl_im[c]; 
hxl_re[c] 2 hx2 re[ c] ; 
hxl, im[c] 2 hx2 im[c]; 
e a 


hx2 re[ c] 2x re; 
hx2 im[c] 2x im; 
| 
| 
for(b 20;b < Height;b + + ) 
| 
p=0; 
for(c=0;c <hp;c+ +) 
| 
if(b & (1« <c)) 
| 
p+=1<<(hp-c-1); 
| 
| 
hd_re[b][j] =hxl_re[p]; 
hd im[b][j] =hxl_im[p]; 
| 
| 
for(i =0;i < Height;i + +) 
| 
for(j =0;j<Width;j+ +) 
| 
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dtemp = sqrt(hd re[i][j] *hd re[i][j] + hd im[i][j] * hd im[i][j])/100; 


if( dtemp » 255) 
| 


dtemp 7255; 
l 


j 


hfd[i][j] = (unsigned char) ( dtemp) ; 


| 
| 
ccs 仿真 设置 


选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗 口 ,右键 单 击 图 像 窗 口 选择 


Properties 进 行 图 像 显 示 配 置 ,如 图 7-5 所 示 。 
实验 结果 


分 段 线性 化 处 理 的 CCS 实验 结果 如 图 7-6 所 示 。 


= AS 
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Image Eap : -— 
Property a | 
4 General 

Title Image 
Background color RGB (255, 255, 255) 
Image format RGB 

4 RGB 
Number of pixels per line 256 
Number of lines 256 
Data format Planar 
Pixel stride (bytes) 1 
Red mask OxFF 
Green mask OxFF 
Blue mask OxFF 
Alpha mask (if any) 0x00 
Line stride (bytes) 256 
Image source Connected Device 
Red start address input 
Green start address input 
Blue start address input 
Alpha start address (if any) : 
Read data a« 8 bit data 

< > 


Fie Edt View Project Tools Run Scripts Window Help Fie Edit View Projet Tools Run Seripts Window Help 
ti * d * $~ tice. SS" is s- C > E 本 ccr+ Rs 
© Debug > 了 AEn 1 k 23 è- 27 


È mainc a D Properties 
double hcc le[Weignt]; x dr 


void asin; 


iaf eig " 3 

[Height] " Read: 
de[seignt]; - 

[weigh] ^^ bmwecsefilte 
Am[weight]; - 


4f Binanes 


ò veid Resdimsge(chor “crilt 
A includes I] Readinage(76:  lenat DM642.cm t 
“toi 
Dabu maine 
i Anversafiitért)3 : A 
p pMedzcmd v |A ~ ) imaget v|| ss — 1f ( fpefopentcrilem v 


« > 2 


pii It. Probleme f 4 ini BE Problema $ 


COT Build Console (inverseliter] a v | om 


Ej Ou Descripsi | ! 53 "Ber Deecriptice 
t+: Build Finished sre * Build finished *** y, 


Lcersed 





a) 原始 图 像 


Fle Edk Viw Project Tools Run Scripts Window Help 
N D ree e- 
*» Debug ^" »- 
pe 
double co ie[nelght]; 


i Densitypht 和 . 
void mainf 
{ 


iB. ExpenentialT: 
Fourier > 
wurerTraref o W eadiesge 
ayscale Co 
inveraefilte 


Mdie (1; 
id Readisegeichor "chile 


1f í fgefopen(c? ilens w 


D |E Problems 


COT Build Console [Ieversefiter] 0 items 
loni Description 


* sutad rimshed *7** « 


licensed Writeble $manineert 47 


c) 滤波 后 图 像 
图 7-6 逆向 滤波 处 理 结果 
7.4 运动 模糊 复原 


成 像 系 统 中 ,引起 图 像 退化 的 原因 有 很 多 ,其 中 最 常见 的 就 是 由 于 摄像 机 和 景物 之 间 的 
相对 运动 导致 图 像 模 糊 。 这 种 模糊 大 多 是 由 于 相机 与 景物 的 相对 速度 快 而 导致 同一 时 刻 不 同 
= o= 
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景物 点 在 感光 元 件 的 同一 点 同时 曝光 而 造成 的 。 在 实际 图 像 复原 中 ,很 多 变速 的 非 直线 的 运 
动 在 一 定 条 件 下 可 以 看 成 是 均匀 的 直线 运动 合成 的 结果 ,因此 对 于 由 均匀 直线 运动 所 造成 的 
模糊 图 像 的 复原 更 具有 现实 意义 。 

7.4. 1 “匀速 直线 运动 模糊 图 像 的 退化 模型 

在 由 匀速 直线 运动 造成 的 图 像 退 化 中 ,用 /Kx,y) 来 表示 退化 过 程 中 的 点 扩散 函数 PSF， 
假设 不 受 其 他 因素 影响 时 ,可 以 得 到 图 像 采集 设备 和 目标 之 间 ye 有 
存在 相互 运动 而 产生 的 退化 模型 可 以 用 图 7.7 来 表示 。 

在 该 模型 中 假设 图 象 Kx,y ) 作 平面 匀速 直线 运动 , 令 (1) 图 77 匀速 直线 运动 模糊 退化 模型 
和 为 (1 分 别 为 在 * 和 y 方 向 上 运动 的 变化 分 量 ,7 表示 运动 的 时 间 。 记 录 介 质 的 总 曝光 量 是 
在 快门 打开 后 到 关闭 这 段 时 间 的 积分 。 设 快门 的 开关 是 瞬时 的 且 成 像 过 程 是 完善 的 , 则 模糊 
后 的 图 象 为 : 


g(x,y) = f fln mmy OD sy CO Jdi (1-17) 
对 上 式 进行 传 立 叶 变换 
G(u,v) = JSE [7 e(a,y)expl - j2 (ux + vy) 1dxdy 
= 人 三 Hz Oy - yo(t) dtexp[ - nux + vy) 1dxdy (7-78) 
此 处 积分 次 序 交 换 后 得 


G(u,v) = | [[ f rts - xy (t) ,y — yo (t) ]exp| - j 2m(ux + vy) ]dxdy ] à 


= [ 1 FCu,v)expl -j 2m(uxo(t) +on(D)]1d 


=F (u,v) f exp] E SER (1-19) 
A 
Huna [expl -j mus C) toy (i) ] tdi (7-80) 
可 以 得 到 | 
Gn d) Hn) ftus) (7-81) 
Plua) (7-82) 


因此 ， 只 要 对 F(u ,v)2K fé vr. e AERE RT DATES] f(x， y)o 
7.4.2” 勺 速 直线 运动 引起 模糊 的 复原 


在 匀速 直线 运动 造成 的 图 像 模 糊 中 ,如 果 模 糊 图 像 是 由 景物 在 x 方向 作 均 匀 直 线 运动 造 
成 的 , 则 模糊 后 的 图 像 任意 点 的 值 为 ; 


eG) = [fts ~ (O1 (783) 
设 图 像 总 的 位 移 量 为 a, 总 的 运动 时 间 为 7, 则 运动 时 间 为 (1) = 名 1, 于 是 有 
= M = 
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7 T 
H(u,v) = | exo! - Daux, (t) | dt = f el - Dau 2 jar 
= L lae - j2mua) (7-84) 
qua 


H13X (7-84) nf JL, FLEX u = 一 求 傅立叶 反 变 换 (n 为 整数 ) 时 ,有 (u,v) =0, 在 这 些 点 上 无 


法 用 逆 滤 波 法 恢复 原 图 像 , 因 而 采用 其 他 方法 。 
由 于 只 考虑 x 方向 ,y 方向 是 不 变 的 , 故 可 暂时 忽略 y, 式 (7-83) 可 写成 : 


Pe e fft - wo (ty ,y]dr = frs - Ja (7-85) 
图 像 的 宽度 为 1。 令 7=x - T: 
g(x) = LF Arat) (7-86) 
对 式 (7-86) 两 边 求 导 ,有 : 
g'(x) e TG) -fx -a)] 
f(x) =FE (0) f(x ca) (7-87) 


3X&07-87) RR T. f(x) FIL f(x -oa) 的 递 推 关 系 。 因 为 g (x) LT a 是 已 知 的 ,因而 知道 了 
长 度 为 a 的 区 间 上 的 原始 图 像 就 可 以 推 得 整 幅 图 像 ,可 设计 一 种 递归 方法 来 复原 图 像 。 
由 于 图 像 在 x 方向 上 的 定义 域 为 0<x<L, 多 数 情 况 下 a<L, 因 而 可 近似 地 认为 :L = Ka, 
K 为 整数 。 这 样 将 区 间 [0 ,万 分 成 开 个 长 度 为 ay 的 子 区 间 , 令 ze[0,a], 第 m 段子 区 间 中 的 
xz 值 可 以 表示 为 ， 
x=z+ma (m 20,1,2,---,K-1) (7-88) 
X4 acm TRAE 
f(z *ma) 2ag'(z * ma) +f [z*(m-1)a] (7-89) 
当 m=0 时 ,有 f(z) =ag' (z) +f(z -a)。 
4 f(z -a) = 小 (z) , 则 
(1) mm =0 时 , 令 
f(z) =ag' (z) + 中 (z) (7-90) 
(2)m=1 时 ,有 f(z+a) 2ag'(z *a) *og'(z) *ó(z). 
以 此 类 推 ,得 到 . 
Krima aX g'(z+ka)$(z) (7-91) 
HF g'(x) aa 为 已 知 , 求 f(x) ,只 需 估 计 出 由 (z) 。 
式 (7-89) 对 m=0,1,2,…,K-1 共 KK 项 累加 得 
X flz+ma) sa $ Sg'(z+ha) e Kó() (7-92) 
则 有 : 
ec 
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由 (z) =$ Ë fima) -ZF $ (s ka) (7-93) 


K m zorzo 
式 (7-93 ) 中 右边 第 一 项 虽然 未 知 ,但 是 当 很 大 时 , 它 趋 于 f(x) 的 平均 值 ,因此 可 以 把 第 
一 项 视 为 一 个 常量 4 从 而 有 : 


p(z) =A -ZF Ëg’ (z+ja) (7-94) 
恢复 图 像 为 : 
f(z * ma) =A -ZF Eat(eho) aX g'(z ka) (7-95) 


H Fz + ka — ka ma =x, Ati Y g'(z * ka) Eas -ma +jia)。 再 利用 关系 ， 


Bg cma +ka) = Š g'(x -ka) (7-96) 
最 后 式 (7-95 ) 可 以 表示 为 : 
f(x) 24 aX g'(x - ka) - y $ g'(a - ha) (7-97) 


再 引入 去 掉 了 的 变量 y, 则 
Kx) 2A aS g'(x -ka,y) -ZF $ (x - hay) (7-98) 
这 就 是 去 除 由 x 方向 上 均匀 运动 造成 的 图 像 模糊 后 恢复 图 像 的 表达 式 。 
考虑 到 在 计算 机 处 理 中 ,多 用 离散 形式 的 公式 , 故 将 式 (7-95) 和 式 (7-97 ) 改 为 离散 形式 : 
glay) =È f (x -学 jw (7-99) 


fixa sa «af EG -ka,y) e -ka -Ax ,y) -23 Se -ka,y) i -ka - Ax,y) 





(7-100) 
7.5 图 像 的 几何 校正 


在 计算 机 视觉 模式 识别 等 领域 中 ,数字 图 像 的 质量 是 非常 重要 的 。 摄 像 机 所 获取 的 图 像 
经 常 存在 畸变 现象 ,因此 在 对 图 像 进行 定量 分 析 和 处 理 之 前 ,必须 进行 畸变 校正 。 在 实际 的 成 
像 系 统 中 ,视频 捕捉 介质 平面 和 物体 平面 之 间 不 可 避免 地 存在 有 一 定 的 转角 和 倾斜 角 。 转 角 
使 图 像 旋转 ,倾斜 角 使 图 像 投影 变形 ,产生 透视 畸变 ;另外 一 种 情况 就 是 由 于 摄像 管 ,摄影 机 及 
阴极 射线 管 显 示 需 的 扫描 偏转 系统 有 一 定 的 非 线性 导致 的 镜头 畸变 ,图 像 往往 呈现 桶 形 或 枕 
形 ;此 外 还 有 由 于 物体 本 身 平面 不 平整 导致 的 曲面 畸变 如 柱 形 畸 变 等 。 这 些 畸 变 统称 为 几何 
畸变 。 
几何 畸变 又 可 分 为 线性 几何 畸变 和 非 线性 几何 畸变 。 通 常情 况 下 ,线性 几何 畸变 指 缩放 、 
平移 旋转 等 畸变 ,目前 已 经 有 很 好 的 校正 方法 ,而 非 线性 几何 畸变 由 成 像 面 和 物 平 面 的 倾斜 、 
物 平面 本 身 的 弯曲 、 光 学 系统 的 像 差 造成 的 畸变 ,表现 为 物体 与 实际 的 成 像 各 部 分 比例 失衡 ， 
非 线性 畸变 图 像 的 校正 是 由 于 其 非 线性 的 复杂 度 ,到 目前 为 止 仍 未 能 得 到 很 好 的 解决 。 
几何 校正 是 指 从 具有 畸变 的 图 像 中 消除 畸变 和 还 原 正 常 图 像 的 处 理 过 程 。 由 成 像 系 统 引 
= 到 
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起 的 几何 失真 的 校正 有 两 种 方法 :一 种 是 预 畸 变法 , 即 采 用 与 畸变 相反 的 非 线性 扫描 偏转 法 ， 
用 来 抵消 预计 的 图 像 畸 变 ; 另 一 种 是 所 谓 的 后 验 校正 方法 ,是 用 多 项 式 曲线 在 水 平和 垂直 方向 
去 拟 合 每 一 畸变 的 网 线 , 然 后 求 得 反 变 换 的 校正 函数 ,用 这 个 校正 函数 即 可 校正 畸变 的 图 像 。 
图 像 的 几何 畸变 及 其 校正 过 程 如 图 7-8 所 示 。 


MON 


理想 已 校正 图 
实际 空间 畸变 zune 空间 变形 校正 


图 7-8 图 像 的 几何 畸变 及 其 校正 过 程 
几何 畸变 校正 分 两 步 : 第 一 步 对 原 图 像 的 像素 坐标 空间 进行 几何 变换 ,以 使 像素 落 在 正确 
的 位 置 上 ;第 二 步 为 插值 ,简要 的 说 就 是 取得 相应 坐标 位 置 上 的 像素 值 。 因 为 一 般 校正 后 的 图 
像 某 些 像 素 点 可 能 分 布 不 均匀 ,有 些 像 素 点 有 时 被 挤 压 在 一 起 ,有 时 又 被 分 散 开 , 使 校正 后 的 
像素 不 落 在 离散 的 坐标 点 上 ,因此 需要 重新 确定 这 些 像素 点 的 灰 度 值 。 


7.5.1 几何 畸变 的 描述 


任何 几何 畸变 都 可 由 非 失真 坐标 系 (x*,y) 变换 到 失真 坐标 系 (x',y') 的 方程 来 定义 。 方 程 
的 一 般 形式 为 
x' =h, (x,y) 
| (7-101) 
y' =h,(x,y) 
在 透视 畸变 的 情况 下 ,变换 是 线性 的 , 即 ; 
=ax +by +c 
y' =dx +ey +f 
VW f(x y) XI PCS CR PEL gC, y ) Je f(x y ) AER, X — A R LEE E AI 
的 ,并 且 用 函数 h(x,y) 和 h,(x,y) 定 义 ,于 是 有 : 
g(x',y') 2f(x,y) 
x' =h (x,y) (7-103) 
y' =h, (x,y) 
这 是 几何 校正 的 基本 关系 式 , 这 说 明 在 图 像 中 本 来 应 该 出 现在 像素 (x,y) 上 的 灰 度 值 由 
于 畸变 实际 上 却 出 现在 (x',y') 上 ,这 种 失真 的 复原 问题 实际 上 是 映射 变换 问题 。 


7.5.2. ”几何 校正 
1. 几何 变换 


从 几何 校正 的 基本 关系 可 见 ,已 知 畸变 图 像 g(x',y') 的 情况 下 要 求 原始 图 像 f(x,y) 的 关 
二 805 一 


(7-102) 
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键 是 要 求 得 函数 h(x,y) 和 h(x,y)。 如 果 由 先 验 知识 知道 h(x,y) 和 h(x,y) , 则 f(x,y) 的 
求 取 就 较为 简单 了 。 其 复原 处 理 可 按 如 下 的 方法 进行 。 

(1) 对 于 f(x,y) 中 的 每 一 个 点 (x yo) TRIB TE gx! y ) 中 相应 的 位 置 (a,B) =[h (x,y) 

h,(x,y) ]。 由 于 a 和 BB 不 一 定 是 整数 ,所 以 通常 (a,B) 不 会 和 g(x',y') 中 的 任何 点 重合 。 

(2) 找 出 g(x',y’ ) 中 与 (a,B) 最 靠近 的 点 (x',y') RBS f(x) =g(x'1,yY'1) ,也 就 是 
把 g(x',y ) 点 的 灰 度 值 赋予 f(x ,y,)。 如 此 逐 点 做 下 去 ,直到 整个 图 像 , 则 几何 畸变 得 到 
校正 。 

但 实际 中 往往 h(x,y) 和 h(x,y) 未 知 ,这 时 可 以 采用 后 验 校正 方法 。 通 常 h (x,y) h (x,y) 
可 用 多 项 式 来 近似 ; 


N N-i n 

x= Day (7-104) 
iz0jz0 
N N-i A 

y' 2 X Eby (7-105) 
iz0jz0 


式 中 , 为 多 项 式 的 次 数 ;a, 、b, 为 各 项 待定 系数 。 

假设 Ku,z) 为 获取 到 的 可 能 存在 畸变 的 图 像 ,7r(x,y) 为 目标 实际 的 图 像 或 理想 图 像 。 那 
么 存在 一 个 非 线性 变换 7, 使 得 两 者 的 坐标 满足 7(wu,v) =T(x,y)。 通 过 一 些 已 知 的 正确 像素 
点 和 畸变 点 间 的 对 应 关系 , 拟 合 出 式 (7-104) 、 式 (7-105 ) 多 项 式 的 待定 系数 a,、b;。 根 据 所 求 
系数 构造 一 个 简单 的 变换 函数 C, 作 为 变换 了 的 近似 表达 式 , 使 得 变换 了 和 C 近似 表达 式 之 间 
的 偏差 最 小 ,能够 反映 所 给 数据 的 总 体 趋势 ,这 就 是 后 验 校正 方法 的 思路 。 当 N =1 时 ,变换 
E =ax +by+c 
y 2dx +ey +f 
通常 也 可 用 这 种 线性 畸变 来 近似 较 小 的 几何 畸变 。 
可 由 基准 图 找 出 三 个 点 (2 7) (yo) (y) SARR E s xy). 

(x'5,y5) (xy ) 一 一 对 应 ,将 对 应 点 坐标 代入 上 式 ,并 写成 矩阵 形式 


(7-106) 








: -2a,-a,x,-ay, 8^] 1 $i fi [e 
%' 2 =a +4% tay; Xs ENT wy 45; (7-107) 
'j 20g * G4 X4 t a4y4 "$ |] &g y4JL8; 
y'i 5b, *b,x, + by, Fil TL & $4] 5 
Y'a 2b, bx, + by, y2 |=|1 x» y |b (7-108) 
Y'3 2 by t bx, + yy, Y'zd El x y,2-5, 























可 用 联 立 方程 组 或 矩阵 求 逆 , 解 出 ao a, a, IE bob, 0,6 个 系数 。 这 样 h (x y) RI h, (x,y) 
可 确定 ,然后 利用 h(x,y) hs (xc, y) 的 变换 复原 此 三 点 连 线 所 包围 的 三 角形 部 分 区 域内 各 点 
像素 。 由 此 每 三 个 一 组 的 点 重复 进行 , 即 可 实现 全 部 图 像 的 几何 校正 。 
更 精确 一 些 可 用 二 次 型 畸变 来 近似 ; 
» =a tax +a,y 十 03% tay t üsy (7-109) 
y’ =b * bx e by * bx +b,xy e by) 
有 12 个 参数 未 知 ,需要 6 对 已 知 坐 标点 (%， DÀ x ay aya Ut asy 32 i Ur uds 
— 28] — 
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(xy'6) 。 写 成 矩阵 形式 有 : 


即 


同 理 有 


人 fI b mÆ, BIRRE h, (x y) M h, (x,y) o 


3 | 0$ xi XY 5 
|] x, y, X) XN y 
] x, y, X3 Xy. Y 


| € Ya S4 4X4 d 





Xs Ys Xs XsYs Ys 
, 


Xe Ye Xe X%6y6 Ye 
L j n n-i l'an 
UT p cs à à ) 


-X6| mS: b xy)! 


iz0j 20 U 


i 


a, 
az 
a3 
a4 


a 





(7-110) 


(7-111) 


(7-112) 


然而 由 于 实际 情况 的 复杂 多 样 , 上 面 各 式 联 立方 程 组 或 矩阵 运算 不 一 定 有 解 或 有 多 组 解 ， 
或 者 不 是 全 局 的 最 优 解 等 ,这 时 就 要 采用 最 小 二 乘法 作为 拟 合 准 则 ,以 保证 求 得 的 h(x,y) 和 
h,(x,y) 函数 在 全 局 上 能 最 好 地 反映 几何 失真 的 情况 。 
设 控制 点 的 个 数 为 工 ,坐标 对 应 关系 如 下 : 


(x', a 3 ) (x^; 3Y 3) — (3 , v. ) NEN 


合 误差 平方 和 最 小 , 即 令 


为 最 小 。 
上 式 的 极 值 条 件 为 


式 中 5s=0,12,0: 


t=0,1,2,.° 


a ^ 
Ms "Ms 


p Faiy ey, = Sip 


es M- 


Tod by Duy = Xxx 


n 


8 


EM 


ia BL). 


tyn — $6 


通常 为 简化 计算 ,在 式 中 只 取 到 二 次 ( 即 n=2) ,得 到 : 


, 


Ta -x 


Tb =y' 


式 中 ,了 为 6x6 和 矩阵 ;ex y 都 是 6 x1 的 列 向 量 。 


二 


L 
zY f^ 
AE X Xy, 
ezl 


T 2 
(E Eau )x,y. = Èy a. 


(xs 一 (2 入 )。 进 行 拟 合 时 ,应 使 拟 


(7-113) 


(7-114) 


(7-115) 


(7-116) 


(7-117) 
(7-118) 
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F-o4 L L L È 
Yl Ly. Ly La, Xx J Lx 
L L : L 3 L L 5 L j 
Du Ly Ly P p J ix y 
A E L L zd 
iy Ly Lx Lxy Lx Y Lay 
T-| , ja à ES : (7-119) 
Xx Xx,y 之 xy ix lay lx, 
L L 2 L 3 L 2 A 2 
lxy Ery Lay Lxy DENE Luy 
e E a L 2 L3 E 4 
| x, 2 xy x, y Xx x, y ix, 
a= [ao Qo Co Qo Gy El (7-120) 
b-[b, bo by by bu hl (7-121) 
L L bs i L L d 
r'| £x Lay, Lay, Lai, Lary Lax (7-122) 
' L D E D i 2 E E £ 2 ý 
- c 2 à». E» Xv. Xo. DU (7-123) 


解 出 方程 组 , 即 可 得 到 拟 合 参数 。 一 旦 得 到 拟 合 参数 ,得 到 非 线性 变换 了 ,就 可 以 对 畸变 
的 图 像 进 行 校正 ,需要 指出 的 是 变换 矩阵 的 阶 数 和 控制 点 数 工 并 没有 直接 的 联系 ,但 是 选取 的 
控制 点 越 多 ,逼近 的 误差 越 小 。 对 原 图 像 中 的 每 一 坐标 (*,y) 按 式 (7-117) (7-118) 计算 出 
其 在 畸变 图 像 上 的 坐标 (x' y) TRI b x y) 的 灰 度 值 情况 给 原始 图 像 中 坐标 (*,y) POR 
素 点 赋值 。 这 时 有 三 种 情况 : 

(1) 如 果 这 一 坐标 恰好 落 在 畸变 图 像 的 像素 点 ,直接 取 此 坐标 对 应 的 像素 值 即 可 ; 

(2) 如 果 这 一 坐标 落 在 图 像 内 而 不 是 像素 点 ,那么 就 需要 参考 (x',y') 附近 的 像素 值 来 对 
(x%,y) 点 处 的 像素 值 做 出 定义 ,这 便 是 下 面 介绍 的 内 插 法 确定 像素 灰 度 值 ; 

(3) 如 果 坐 标 落 在 畸变 图 像 的 外 边 , 则 用 最 靠近 它 的 图 像 的 像素 点 的 灰 度 值 作为 它 的 灰 
度 值 。 

2. 内 插 法 确定 像素 灰 度 值 

众所周知 ,数字 图 像 中 的 坐标 (x,y) 总 是 整数 。 由 于 失真 图 像 是 数字 图 像 , 其 像素 值 仅 在 
坐标 为 整数 处 有 定义 。 非 整数 处 的 像素 值 就 需要 通过 一 定 的 手段 来 推断 ,用 来 完成 该 任务 的 
技术 称 为 灰 度 插值 。 常 用 的 方法 有 最 近邻 法 、 双 线性 内 插 法 和 三 次 卷 积 法 。 

(1) 最 近邻 插值 

最 近邻 插值 是 一 种 简单 的 插值 算法 ,也 称 为 零 阶 插值 。 输 出 的 像素 灰 度 值 就 等 于 距离 它 
映射 到 的 位 置 最 近 的 输入 像素 的 灰 度 值 。 最 近邻 插值 是 工具 箱 函 数 默 认 使 用 的 插值 方法 ,而 
且 这 种 捅 值 方法 的 运算 量 非常 小 。 对 于 索引 图 像 来 说 , 它 是 唯一 可 行 的 方法 。 其 缺点 是 不 能 
精确 地 反映 实际 情况 的 像素 值 , 甚 至 经 常 产 生 不 希望 的 人 为 症 点 ,如 高 分 辨 率 图 像 直 边 的 


扭曲 。 
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若 原 图 像 上 坐标 为 (x,y) 的 像素 经 变换 后 落 在 畸变 图 像 g(x',y') 内 的 坐标 为 (u,v) , 则 最 
近邻 搬 值 的 数学 表达 式 为 : 


f(x,y) 2 gx.) (7-124) 
HEP x,y WE: 
IG. +4) <u CHR) 
1 1 (7-125) 
FN +y) «u «mr y) 
(2) 双 线性 内 插 法 


双 线 性 内 插 法 是 对 最 近邻 插值 法 的 一 种 改进 , 即 用 线性 内 插 方法 ,根据 点 P(xo ,yo) 的 4 
个 相 邻 点 的 灰 度 值 ,通过 两 次 插值 计算 出 灰 度 值 f(x ,yo) ,能 够 得 到 一 个 像素 值 较为 连贯 的 恢 
复 图 像 ,如 图 7-9 所 示 。 








图 7-9 ” 双 线 性 内 插 法 


具体 计算 情况 如 下 : 
中 计算 出 w MB: 
(7-126) 
B=% -Y 
DRHE f(x y) ,Kx +l,y) 插 值 求 Kxu,y) : 
f(xs.y) 2f(x,y) *alf(x *1,y) -f(x,y)] (7-127) 
GRRAR f(x y +1) ,f(x+1,y) 插 值 求 f(xo,y+1): 
fxosy +1) =f(x,y +1) +alf(x+1,y+1) -f(x,y +1)] (7-128) 


@ 根 据 f(xo,y) 及 f(xo,y+1) 插 值 求 f(xo ,yo): 
f yo) mf xo y) +BLf(xosy +1) -f(x0,7)] 
z (1 -a)(1 -B)f(x,y) ta(l -B(x +1,y) + (1 -a)Bf(x,y +1) «Bof(x +1,y +1) 
zf(x,y) tala *1,y) -f(x,y)] +B *1,y) -f(s,5)] + 
Ba f(x -1,y +1) -f(x,y) -f(x,y -1) -f(x*l,y)] (7-129) 
AP, = [lr] ls 
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双 线 性 灰 度 插值 计算 方法 由 于 已 经 考虑 到 了 点 P(xo ,yo ) 的 直接 邻 点 对 它 的 影响 ,因此 一 
般 可 以 得 到 令 人 满意 的 插值 效果 ,缩放 后 图 像 质量 较 高 并 且 消 除了 插值 后 像素 值 不 连续 的 情 
况 。 但 是 双 线 性 插值 法 计算 量 较 零 阶 插值 增 大 ,而且 这 种 方法 具有 低 通 滤 波 性 质 , 使 高 频 分 量 
受到 损失 ,使 图 像 细节 退化 而 变 得 轮廓 模糊 。 在 某 些 应 用 中 , 双 线性 灰 度 插值 的 斜率 不 连续 还 
可 能 会 产生 一 些 不 期 望 的 结果 。 

在 几何 运算 中 ; 双 线 性 灰 度 插值 的 平滑 作用 可 能 会 使 图 像 的 细节 产生 退化 ,在 进行 放大 处 
理 时 ,这 种 影响 将 更 为 明显 。 而 在 其 他 应 用 中 , 双 线 性 插值 的 斜率 不 连续 性 会 产生 不 希望 看 到 
的 结果 。 这 两 种 情况 都 可 通过 高 阶 插值 得 到 修正 , 当然 这 会 增加 计算 量 ,这 里 就 不 详细 介 
8T. 


7.6 本 章 小 结 


图 像 复原 是 图 像 处 理 重要 的 研究 领域 。 本 章 介 绍 了 图 像 退 化 模型 的 基本 框架 ,并 将 其 分 
为 连续 退化 模型 和 离散 退化 模型 分 开 详细 描述 。 同 时 分 析 了 图 像 复原 方法 、 运 动 模糊 复原 方 
法 以 及 图 像 几 何 校正 方法 。 





. 简 述 图 像 退化 模型 。 

常见 的 图 像 复原 方法 有 哪些 ? 

图 像 复 原 与 图 像 增强 处 理 的 目标 和 结果 有 哪些 不 同 ? 

什么 是 线性 和 空间 位 置 不 变 系统 ? 试 写 出 其 表达 式 。 

试 简要 介绍 反 向 滤波 的 原理 ,分 析 其 难点 是 什么 ,怎样 来 克服 ? 
试 简要 说 明 引 起 运动 模糊 的 原因 及 如 何 恢复 运动 模糊 图 像 ? 


QN Un 和 Nt — 
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第 8 章 图 像 特征 描述 与 形态 分 析 


8.1 前 言 


在 图 像 处 理 过 程 中 ,图 像 特 征 描述 与 形态 分 析 能 够 便于 有 效 从 图 像 中 获取 、 分 析 所 需 的 有 
效 信息 。 图 像 特 征 描 述 是 指 用 某 些 简单 明确 的 数值 符号 来 表征 图 像 中 具有 不 同 特征 信息 及 
已 分 割 的 区 域 。 形 态 分 析 是 指 以 图 像 的 形态 特征 为 研究 对 象 ,分 析 描 述 图 像 中 元 素 与 元 素 .部 
分 与 部 分 间 的 关系 。 高 质量 的 图 像 描述 能 够 便于 图 像 处 理 系统 从 图 像 滤 除 无 关 信 息 ,将 目标 
信息 从 图 像 中 分 离 出 来 。 图 像 形态 学 处 理 能 够 用 于 获取 图 像 边缘 等 重要 信息 ,在 工业 和 军事 
领域 有 着 广泛 的 应 用 。 本 章 将 从 灰 度 描述 边界 描述 、 区 域 描 述 、 纹 理 描述 等 来 介绍 几 种 经 典 
的 图 像 特 征 描 述 方法 ,通过 对 腐蚀 、 膨 胀 等 常用 方法 来 详细 阐述 图 像 形 态 学 处 理 的 有 关 定 义 、 
原理 和 方法 。 


8.2 ” 灰 度 特征 描述 


在 数字 图 像 中 ,像素 是 最 基本 的 表示 单位 , 灰 度 图 像 中 各 个 像素 点 值 只 代表 该 点 的 灰 度 即 
各 点 的 亮 暗 程度 。 灰 度 图 像 与 黑白 图 像 不 同 ,在 计算 机 图 像 领 域 中 黑白 图 像 只 有 黑色 与 白色 
两 种 颜色 。 灰 度 图 像 在 黑色 与 白色 之 间 还 有 许多 级 的 颜色 深度 , 每 个 像素 的 灰 度 值 用 [ 0， 
255 ] 区 间 的 整数 表示 , 即 图 像 分 为 256 个 灰 度 等 级 。 对 于 彩色 图 像 ,每 个 像素 都 是 由 RG、B 
三 个 单 色调 配 而 成 。 如 果 每 个 像素 的 RG.B 完全 相同 ,也 就 是 R=G =B = 了 ,该 图 像 就 是 灰 度 
图 像 , 其 中 工 被 称 为 各 个 像素 的 灰 度 值 。 由 彩色 转化 为 灰 度 的 过 程 叫 做 灰 度 化 处 理 ; 由 灰 度 
化 转 为 彩色 的 过 程 称 为 伪 彩 色 处 理 。 

(BÆ, H FARX R, G B 三 个 分 量 亮度 的 敏感 度 不 一 样 , 可 以 使 用 亮度 作为 图 像 灰 度 化 
的 依据 。 图 像 灰 度 化 的 主要 方法 如 下 所 述 。 

(D RAKES : (E R CB 的 值 等 于 3 值 中 最 大 的 一 个 , 即 


R-2G-B-max(R,G,B) (8-1) 
(2) 平 均值 法 :使 RG.B 的 值 求 出 平均 值 , 即 
R=G=B=(R+G+B)/3 (8-2) 


(3) 加权 平 均值 法 :等 量 的 RG.B 混合 不 能 得 到 白色 , 故 其 混合 比例 需要 调整 。 大 量 的 
试验 数据 表明 , 当 采 用 0.299 份 的 红色 .0.587 份 的 绿色 和 0. 114 份 的 蓝 色 混合 后 可 以 得 到 白 
色 , 因 此 彩色 图 像 可 以 根据 以 下 公式 变 为 灰 度 图 像 ; 

m = 
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Y 20.299 x R +0. 587 xG+0.114xB (8-3) 

8.2.1 幅度 特征 

在 所 有 的 图 像 特 征 中 ,最 基本 的 是 图 像 的 幅度 特征 。 图 像 特征 可 以 是 人 类 视觉 能 够 识别 
的 自然 特征 ;也 可 以 是 人 为 定义 的 某 些 特征 。 可 以 在 某 一 像素 点 或 其 邻 域 内 做 出 幅度 的 测量 。 

灰 度 图 像 的 平均 幅度 是 指 一 幅 图 像 所 有 像素 点 灰 度 值 的 平均 值 ,通过 计算 一 幅 图 像 的 平 
均 幅 度 可 以 推断 出 该 图 像 是 否 偏 暗 或 偏 亮 。 如 果 计 算出 一 幅 图 像 的 平均 幅度 比较 小 ,可 能 这 
幅 图 像 给 我 们 的 直观 感觉 是 偏 暗 的 。 反 之 ,幅度 越 大 则 表明 该 灰 度 图 像 整体 颜色 偏 亮 。 例 如 
TE N x N 区 域内 的 平均 幅度 , 即 . 
Jo = imi) (8-4) 

可 以 直接 从 图 像 像 素 的 灰 度 值 ,或 从 某 些 线性 、 非 线性 变换 后 构成 新 的 图 像 幅度 的 空间 来 
求 得 各 式 各 样 图 像 的 幅度 特征 图 。 图 像 的 幅度 特征 对 于 分 离 目标 物 的 描述 等 具有 十 分 重要 的 
作用 。 如 图 8-1 所 示 , 其 中 ,图 8-1a) 是 原 图 ,图 8-1b) 是 利用 幅度 特征 将 背景 中 的 汽车 分 割 出 
来 的 结果 。 























b) 利用 幅度 特征 将 目标 分 割 出 来 
图 8-1 利用 灰 度 信息 将 目标 分 割 出 来 


8.2.2 直方 图 特征 











数字 图 像 在 本 质 上 可 以 看 作 二 维 或 者 多 维 的 数组 ,数组 中 的 值 按照 不 同 的 定义 表征 不 同 
的 信息 。 通 过 统计 图 像 各 像素 幅度 值 可 以 设法 估计 出 图 像 的 概率 分 布 ,进而 在 坐标 系 中 表示 
出 来 ,从 而 形成 直方 图 特征 。 灰 度 直方 图 的 横 坐 标 是 灰 度 级 , 纵 坐 标 是 该 灰 度 级 出 现 的 频率 ， 
是 图 象 的 重要 的 统计 特征 。 

图 像 灰 度 的 一 阶 概率 分 布 定义 为 











P(b) -Pif(x,y) =b? (OSb<L-1) (8-5) 
式 中 ,b 为 量化 值 ;L 为 量化 值 范 围 。 
p(b) - SA (8-6) 


其 中 ,M 为 围绕 (x,y) 点 被 测 窗口 内 的 像素 点 总 数 ;N(5) 为 该 窗口 内 灰 度 值 为 b 的 像素 


= 284 


图 像 处 理 与 机 器 视觉 


通过 分 析 图 像 的 直方 图 ,可 以 获取 与 图 像 信 息 有 关 的 许多 特征 。 例 如 若 直 方 图 密集 地 分 
布 在 很 窄 的 区 域 之 内 ,说 明 图 像 的 对 比 度 很 低 ; 若 直方 图 有 两 个 峰值 , 则 说 明 存在 着 两 种 不 同 
亮度 的 区 域 ; 若 一 幅 图 像 其 像素 占有 全 部 可 能 的 灰 度 级 并 且 分 布 均匀 , 则 这 样 的 图 像 有 高 对 比 
度 和 多 变 的 灰 度 色调 。 


一 阶 直方 图 的 特征 参数 以 下 。 
(1) 平 均值 : 

b = YPQ) (8-7) 
(JAA: 

o? =È (b -b)P() (8-8) 
(3) 倾斜 度 : 

b, - Ly (b -by'P() (89) 

mE 

(4) If E. 

b, "AO -b)'P(A) -3 (8-10) 
(5) ES 

b, = IPOD! (8-11) 
(6) fili 

b, = - X P(b)log,[ P(B) ] (8-12) 


二 阶 直方 图 特征 是 以 像素 对 的 联合 概率 分 布 为 基础 得 出 的 。 若 两 个 像素 f(i,j) 及 f(m,n) 
DIEF GS Am, n) 点 ,两 者 的 间距 为 |i-m|、|j-n|, 并 可 用 极 坐标 p、9 表达 ,那么 其 
幅度 值 的 联合 分 布 为 : 


P(a,b) AP, |f(i,j) -a,f(m,n) -b| (8-13) 
式 中 ,为 量化 的 幅度 值 。 因 此 直方 图 估计 的 二 阶 分 布 为 ; 


P(a,b) «SG (8-14) 


式 中 ,N(a,b) 表 示 图 像 在 9 方向 上 ,\ 径 向 间距 为 p 的 像素 对 f(i,j) =a, f(m,n) =b 出 现 的 
频数 ;M 为 测量 窗口 中 像素 的 总 数 。 

假设 图 像 的 各 像素 对 都 是 相互 关联 的 , 则 P(a,65) 将 在 阵列 的 对 角 线 上 密集 起 来 。 以 下 列 
出 一 些 度量 ,用 来 描述 围绕 P(a,b) 对 角 线 能 量 扩散 的 情况 。 


(1) 自 相关 : 
B, = È Y abP(a,b) (8-15) 
(2) 协 方差 : 
B, - $$ (a-a)(5-b)P(a,b) (8-16) 
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(3 ) 惯 性 矩 ， 

B, - È È (a - b)? P(a,b) (8-17) 
(4) 4X Pi 

B, = È È la -b|P(a,b) (8-18) 
(5) 能 量 ; » 

By = $ È[P(a,b)]? (8-19) 
(6i; o 

B, = - È È P(a,b)log [P(a,b) | (8-20) 


8.2.3 变换 系数 特征 


传 立 叶 变换 是 数字 图 像 处 理 技术 的 基础 ,图 像 从 空间 域 到 频率 域 变换 的 系数 反映 了 变换 
后 图 像 在 频率 域 的 分 布 情况 ,二 维 的 傅立叶 变换 作为 图 像 变换 的 常用 方法 ,可 以 用 来 表征 图 像 
在 频 域 的 特征 信息 。 通 过 在 时 域 和 频 域 来 回 切换 图 像 ,按照 一 定 的 图 像 处 理 算法 对 图 像 的 信 
息 特 征 进行 提取 和 分 析 。 例 如 


Prais [emm dxdy (8-21) 
设 M(wu,v) 是 FF(u,v) 的 平方 值 , 即 
M(u,v) = |F(u,v) | (8-22) 


在 图 像 变换 中 ,由 傅立叶 级 数 的 性 质 , 当 f(x,y) 相 对 原点 平移 时 ,F(u,v) 的 幅 值 不 发 生变 
换 , 则 M(wu,v) 的 值 保 持 不 变 ,因此 M(w,v) 与 fx,y) .Ff(u,v) 不 是 唯一 对 应 的 ,这 种 性 质 称 为 
位 移 不 变性 。 在 某 些 应 用 中 可 利用 这 一 特点 。 

如 果 把 MM(w,v) 在 某 些 规 定 区 域内 的 累计 值 求 出 ,也 可 以 把 图 像 的 某 些 特征 突出 ,这 些 规 
定 的 区 域 如 图 8-2 所 示 , 其 中 图 8-2a) 为 水 平 切口 ,图 8-2b) 为 垂直 切口 ,图 8-2c ) 为 环形 切口 。 





a) 水 平 切口 b) 垂直 切口 
图 8-2 不 同类 型 的 切口 


由 各 种 不 同 切口 规定 的 特征 度量 可 由 下 面 各 式 来 定义 。 
(1) 水 平 切口 : 


Sms METODO (823) 


(2)3& RUJH ; 
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u( ml) 
S,(m).- J Mio) du (8-24) 
(3) 环 状 切口 : 
人 (825) 


式 中 ,M(p,9) 为 M(u,v) 的 极 坐 标 形式 。 

这 些 特征 说 明了 图 像 中 含有 这 些 切 口 的 频谱 成 分 的 含量 。 把 这 些 特征 提取 出 来 以 后 ,可 
以 作为 模式 识别 或 分 类 系统 的 输入 信息 。 这 种 方法 已 经 成 功 地 运用 到 大 地 特征 分 类 、 放 射 昭 
片 病情 诊断 。 

图 像 不 同 的 特征 都 能 表示 和 鉴别 图 像 , 但 反映 的 是 图 像 不 同 的 特性 ,因此 ,不 同 的 特征 用 
途 也 不 同 ,用 于 检测 和 鉴别 时 的 性 能 也 会 不 同 ,应 用 背景 也 不 同 。 针 对 不 同 的 应 用 场合 和 和 需 
求 , 要 选择 不 同 的 特征 用 于 图 像 检测 和 图 像 识别 。 


8.3 边界 描述 


图 像 边缘 是 图 像 局 部 特性 不 连续 的 反应 ,包含 了 大 量 的 图 像 内 在 信息 ,是 图 像 最 基本 的 特 
征 。 同 时 是 图 像 分 析 和 图 像 识 别提 取 目 标 物体 轮廓 的 一 个 重要 环节 。 为 了 描述 目标 物 的 二 维 
形状 ,通常 采用 的 方法 是 利用 目标 物 的 边界 来 表示 物体 , 即 边 界 描述 。 当 一 个 目标 区 域 边界 上 
的 点 已 被 确定 时 ,就 可 以 利用 这 些 边界 点 来 区 别 不 同 区 域 的 形状 。 这 样 做 既 可 以 节省 存储 空 
间 , 叉 可 以 准确 的 确定 物体 下面 介绍 两 种 常用 的 边界 描述 方法 。 

8.3.1 链 码 摘 述 


在 数字 图 像 中 ,边界 或 者 曲线 是 由 一 系列 离散 的 像素 点 组 成 ,其 最 简单 的 表示 方法 是 由 美 
国学 者 Freeman 提出 的 链 人 三 方式 。 

链 码 的 基本 思想 是 先 用 某 种 规则 的 单元 格 将 平面 铺 满 ,然后 对 目标 图 像 边界 上 的 每 一 个 
像素 根据 与 之 相连 的 像素 的 情况 进行 编码 。 从 图 像 边 界 上 的 任意 一 个 像素 开始 , 按 一 定 的 方 
向 顺 时 针 方 向 或 逆 时 针 方 向 沿 着 图 像 边 界 走 一 图, 依次 将 所 有 像素 点 的 编码 记录 下 来 ,所 形成 
的 序列 就 是 该 图 像 的 链 码 。 链 码 可 以 由 所 标定 对 象 边界 上 每 个 像素 的 边 所 对 应 的 码 依 序 组 
成 ,也 可 以 由 边界 上 每 个 像素 的 顶点 所 对 应 的 码 组 成 ,利用 像素 点 的 边 进行 标定 的 链 码 称 为 边 
界 链 码 ,利用 顶点 标定 的 称 为 顶点 链 码 。 

链 码 实质 上 是 一 串 指向 符 的 序列 ,有 4 向 链 码 S 向 链 码 等 。 图 8-3 为 4 向 链 码 和 8 向 链 码 。 


1 


3 2 1 
2 0 4 0 
3 5 6 7 


图 8-3 4 向 链 码 和 8 In] SER 
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对 任 一 像素 点 ,考虑 它 的 8 个 临近 像素 ,指向 符 共 有 8 个 方向 ,分 别 用 0、1、2、3、4、5 .6、7 
表示 。 链 码 表示 就 是 从 某 一 起 点 开始 沿 曲线 观察 每 一 段 的 走向 并 用 相应 的 指向 符 来 表示 , 结 
果 形 成 一 个 数列 。 因 此 可 以 用 链 码 来 描述 任意 曲线 或 者 闭合 边界 。 如 图 84 中 ,选取 像素 4 
作为 起 点 ,形成 的 链 码 为 0112223310000755666770。 

从 上 面 的 定义 方法 中 可 以 看 到 ,利用 链 码 来 表示 和 存储 物体 信息 ,是 很 方便 和 节省 空 
间 的 。 

链 码 描述 符 的 缺点 为 : 链 码 描述 符 本 身 不 具有 旋转 不 变性 , 当 目 标 图 像 发 生 旋转 或 起 点 发 
生 改 变 时 , 链 码 的 描述 结果 也 会 随 之 改变 。 另 外 ,该 方法 对 噪声 十 分 敏感 , 当 噪 声 影 响 或 边界 
片段 有 缺陷 时 , 链 码 也 会 发 生变 化 。 利 用 链 码 表示 给 定 目标 的 边界 时 ,如 果 目 标 平移 , 链 码 不 
会 发 生变 化 ,而 如 果 目 标 旋转 , 链 码 也 会 发 生变 化 。 为 解决 这 个 问题 ,可 利用 链 码 的 一 阶 差 分 
来 重新 构造 一 个 表示 原 链 码 各 段 之 间 方 向 变化 的 新 序列 ,这 相当 于 把 链 码 进行 旋转 归 一 化 。 差 分 
链 码 可 用 相 邻 两 个 方向 数 按 反 方向 相 减 (后 一 个 减 去 前 一 个 ) ,并 对 结果 作 模 8 运算 得 到 。 例 如 ; 
图 8-4 中 曲线 的 链 码 为 0112223310000755666770, 其 差分 链 码 为 101001067000760100101 ; 图 8-5 是 
图 8-4 中 曲线 顺 时 针 旋 转 90° 后 得 到 的 , 曲线 的 链 码 为 6770001176666533444556 , 其 差分 链 码 
为 101001067000760100101 。 





































































































图 8-4 原 链 码 方 向 图 8-5 顺 时 针 旋 转 90° 


由 此 可 见 ,一 条 曲线 旋转 到 不 同位 置 将 对 应 不 同 的 链 码 ,但 其 差分 链 码 不 变 , 即 差分 链 码 
关于 曲线 旋转 式 不 变 。 近 年 来 ,由 于 链 码 可 以 使 用 较 少 的 数据 存储 较 多 的 信息 ,被 广泛 应 用 于 
图 像 处 理 、 计 算 机 图 形 学 模式 识别 等 领域 。 

8.3.2 傅立叶 描述 


傅立叶 形状 描述 符 是 对 图 像 边缘 信息 频 域 分 析 处 理 得 到 的 傅立叶 变换 系数 。 对 边界 的 离 

散 傅立叶 变换 表达 ,可 以 作为 定量 描述 边界 形状 的 基础 。 采 用 侍 立 叶 描 述 的 一 个 优点 是 将 二 

维 的 问题 化 简 为 一 维 问 题 。 即 将 x -y 平 面 中 的 曲线 段 转化 为 一 维 函 数 A7r)[ 在 r -f(r) 平 面 

上 ] ,也 可 将 x -y 平 面 中 的 曲线 段 转化 为 复 平面 上 的 一 个 序列 。 具 体 就 是 将 x -y 平 面 与 复 平 

H u-v 重合 ,其 中 实 部 轴 与 x 轴 重 合 , 虚 部 v 轴 与 y 轴 重 合 。 这 样 可 用 复数 v +jv 的 形式 来 
— 291 = 


图 像 处 理 与 机 器 视觉 


表示 给 定 边界 上 的 每 个 点 (x,y)。 这 两 种 表示 在 本 质 上 是 一 致 的 ,是 点 对 应 点 。 
现 考 虑 一 个 由 NN 点 组 成 的 封闭 边界 ,从 任 一 点 开始 绕 边界 一 周 就 得 到 一 个 复数 序列 , 即 . 


s(k) =u(k) +jv(k) (kz0,1,-,N-1) (8-26) 
s(k) 的 离散 傅立叶 变换 是 ; 
S(w) PROE JE (w20,1,--:, N -1) (8-27) 
S(z2) 可 称 为 边界 的 傅立叶 描述 , 它 的 伟 立 叶 逆 变换 是 ， 
s(Kk) - Esco)ew[ me T NEN RAD. (828) 


可 见 ,离散 傅立叶 变换 是 可 逆 线 性 变换 ,在 变换 过 程 中 信息 没有 任何 增 减 ,这 为 我 们 有 选 
择 地 描述 边界 提供 了 方便 ,只 取 S(w) 的 前 个 系数 即 可 得 到 s) 的 一 个 近似 : 


SC) = SCw) exp -j2 8) E EE ET (8-29) 
式 (8-29) 中 的 范围 不 变 , 即 在 近似 边界 上 的 点 数 不 变 ,但 w 的 范围 缩小 了 , 即 重建 边界 
点 所 需 的 频率 阶 数 减少 了 。 傅 立 叶 变换 的 高 频 分 量 对 应 一 些 细节 而 低频 分 量 对 应 总 体形 状 ， 
因此 用 一 些 低频 分 量 的 傅立叶 系数 足以 近似 描述 边界 形状 。 
经 过 长 时 间 的 研究 发 现 , 傅 立 叶 形状 描述 对 形状 特征 有 着 极 强 的 描述 与 识别 能 力 ,通过 与 
其 他 经 典 算法 相 比 ,傅立叶 形状 描述 符 拥有 计算 简单 ,速度 较 快 描述 准确 等 优势 ,目前 该 算法 
已 成 为 基于 形状 描述 方法 中 最 为 常用 的 算法 之 一 。 


8.4 纹理 描述 


纹理 一 般 是 指 人 们 所 观察 到 的 图 像 像素 (或 子 区 域 ) 的 灰 度 变化 规律 。 习 惯 上 把 图 像 中 
这 种 局 部 不 规则 而 宏观 有 规律 的 特性 称 之 为 纹理 。 由 于 物体 表面 的 物性 不 同 , 反 映 在 图 像 上 ， 
表现 为 亮度 ,颜色 的 变化 。 因 此 ,纹理 是 由 于 物体 表面 的 物理 属性 不 同 所 引起 的 能 够 表示 某 个 
特定 表面 特征 的 灰 度 或 者 颜色 信息 ,图像 纹理 可 以 定性 地 用 以 下 一 种 或 几 种 特征 来 描述 粗糙 
的 细致 的 ,粒状 的 ,平滑 的 \ 线 状 的 、 波 浪 状 的 或 斑 驶 的 ,不 同 的 图 像 对 应 着 不 同 的 纹理 特征 ， 
而 且 很 容易 被 人 所 感知 ,我 们 可 以 从 纹理 上 获得 非常 丰富 的 视觉 场景 信息 ,并 能 通过 纹理 分 析 
方法 来 完成 计算 机 视觉 和 图 像 理解 研究 领域 的 一 些 研究 任务 。 

一 般 来 说 纹理 图 像 中 的 灰 度 分 布 具 有 周期 性 ,即使 灰 度 变 化 是 随机 的 ,也 具有 一 定 的 统计 
特性 。 纹 理 的 标志 有 三 个 要 素 :一 是 一 些 局 部 的 “ 序 ” 在 一 个 相对 于 序 的 尺寸 足够 大 的 区 域 中 
重复 ;二 是 序列 由 基本 部 分 非 随 机 排列 组 成 ;三 是 在 纹理 区 域内 任何 地 方 都 具有 近似 同样 维 数 
的 均一 实体 部 分 。 当 然 ,以 上 这 些 从 感觉 上 看 是 合理 的 ,并 不 能 得 出 定量 的 纹理 测定 。 正 因为 
如 此 ,对 纹理 特性 的 研究 方法 也 是 多 种 多 样 的 。 

根据 纹理 的 局 部 统计 特征 可 以 将 纹理 大 致 分 为 人 工 纹理 和 自然 纹理 ,人 工 纹理 往往 是 确 
定性 的 结构 型 纹理 ,多 由 线条 ` 三 角形 矩形、 圆 、 多 边 形 等 有 规律 地 排列 组 成 。 自 然 纹理 通常 
是 随机 的 。 通 过 对 实际 图 片 的 观察 ,可 以 看 到 ,由 种 子 或 草地 之 类 构成 的 图 片 ,表现 的 是 自然 
纹理 图 像 ; 由 组 织 或 砖 墙 等 构成 的 图 片 ,表现 的 是 人 工 纹理 图 像 。 如 图 8-6 所 示 。 具 有 独立 基 
本 结构 与 明显 周期 性 的 纹理 为 结构 型 纹理 (如 裂纹 、 砖 墙 ) ,反之 称 为 随机 型 纹理 ( 如 气象 去 
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2) 结构 型 纹理 b) 随机 型 纹理 


图 8-6 结构 型 纹理 和 随机 型 纹理 比较 


特征 提取 是 纹理 分 析 的 基础 ,好 的 纹理 特征 具有 四 个 主要 用 途 : 纹 理 分 类 .纹理 分 制 纹理 
检索 以 及 纹理 形状 抽取 。 用 于 纹理 分 析 的 算法 很 多 ,这 些 方法 可 大 致 分 为 统计 分 析 和 结构 分 
析 两 大 类 ,前 者 从 图 像 有 关 属 性 的 统计 分 析出 发 ,后 者 则 着 力 找 出 纹理 基 元 ,再 从 结构 组 成 上 
探索 纹理 的 规律 。 为 了 强化 分 类 ,可 以 从 灰 度 图 像 计算 灰 度 共生 矩阵 、 能 量 .相关 以 及 炳 等 纹 
理 特性 。 当 纹理 基 元 很 小 并 成 为 微 纹理 时 ,统计 方法 特别 有 用 , 它 广泛 应 用 于 纹理 分 析 中 ; 相 
反 , 当 纹理 基 元 很 大 时 ,应 使 用 结构 化 方法 , 即 首先 确定 基 元 的 形状 和 性 质 ,然后 ,再 确定 控制 
这 些 基 元 位 置 的 规则 ,这 样 就 形成 了 宏 纹理 。 本 节 将 介绍 一 些 常用 的 纹理 分 析 方 法 。 

8.4.1 ED 

统计 方法 基于 图 像 的 灰 度 空间 分 布 情形 来 描述 粗细 均匀 性 ,方向 性 等 纹理 信息 。 纹 理 分 
析 的 最 简单 方法 是 基于 图 像 灰 度 直方 图 的 矩 分 析 法 ,例如 均值 方差 ,扭曲 度 和 峰值 等 纹理 特 
征 。 令 为 一 代表 灰 度 级 的 随机 变量 ,并 令 /( 扣 ) ,i =0,1,2,…,NN -1, 为 对 应 的 灰 度 直方 图 ， 
这 里 Y 是 可 区 分 的 灰 度 级 数目 , 则 常用 的 矩 评价 参数 可 采用 如 下 公式 表示 。 

(1) 均 值 

n= Y fU) (830) 


均值 给 出 了 该 图 像 区 域 平均 灰 度 水 平 的 估计 值 ,一 般 不 反映 什么 具体 纹理 特征 ,但 可 以 反 
映 纹 理 的 “ 光 密 度 值 ”。 


OEE- 
o? = È (s - a fk) (8-31) 
方差 则 表明 区 域 灰 度 的 离散 程度 , 它 一 般 反应 图 像 纹理 的 幅度 。 
(3) 扭 曲 度 
us =Æ F (h, - Y hk) (832) 


扭曲 度 反 映 直 方 图 的 对 称 性 , 它 表 示 偏 离 平 均 灰 度 像素 的 百分比 。 
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(4) 峰 度 | 
pa =F È US af) -3 (8-33) 
峰 度 反映 直方 图 是 倾向 于 聚集 在 均值 附近 还 是 散布 在 尾 端 。 式 (84) 减 3 的 目的 是 为 保 
证 峰 度 的 高 斯 分 布 为 零 。 
(5) 
H= = Ef) op) (8-34) 
虽然 图 像 灰 度 直方 图 的 矩 分 析 法 非常 简单 ,并 且 易 于 计算 ,然而 ,由 图 像 灰 度 直方 图 的 不 
唯一 性 可 知 ,图 像 纹理 相差 很 大 的 两 幅 图 像 其 直方 图 可 能 相同 。 因 此 ,基于 灰 度 直方 图 的 矩 分 
析 法 并 没有 充分 利用 图 像 的 纹理 信息 ,不 能 完全 反映 这 两 幅 图 像 的 纹理 差异 ,难以 完整 表达 纹 
理 的 空间 域 特征 信息 。 
8.4.0 ”有 厌 度 差分 统计 法 
灰 度 差分 指 的 是 图 像 中 某 点 与 其 只 有 微小 距离 的 点 的 灰 度 差 值 , 即 m (xy) mf (xy) - 
f(x +Ax,y +Ay) ,其 中 & 表示 灰 度 差分 。 设 灰 度 差分 值 共有 m 级 ,点 (x,y) 在 整 幅 图 像 上 移 
动 ,统计 出 g(x,y) 取 各 个 数值 的 次 数 , 既 可 以 知道 g(x,y) 取 值 的 概率 p,(i) 。 当 取 较 小 i 值 
概率 p(i) 较 大 时 ,说 明 纹理 较 粗 烽 ; 当 概率 较 小 时 ,说 明 纹理 较 细 。 
通常 利用 如 下 5 个 参数 描述 纹理 图 像 的 特征 。 
(1) 对比度 
CON = $ip, (i) (8-35) 
对 比 度 ( CON) 是 差分 直方 图 p, 关于 i=0 的 惯性 矩 , 它 是 灰 度 差分 对 比 度 的 度量 ;对 比 度 
反映 纹理 沟 纹 深浅 ,CON 大 ,纹理 深 。 
(2) 能 量 
E-Y Dp.) (836) 
BERE (E) REOR 4) 81) PEG BEHIE 4 p, CO (EBEP, E BEES Ti pa C) IR 
均 时 ,E 值 较 大 。 
(3) 精 
ENT = - Spa (i) logspa i) (837) 
M CENT) 表示 图 像 中 纹理 的 非 均匀 程度 和 复杂 程度 ,反映 差分 直方 图 的 一 致 性 , 对 于 均匀 
4t E] 837 8 pe RC D 
(4) 角度 方向 二 阶 盾 
ASM = - Ep) (8-38) 
JAREN EI IME (ASM) 反映 图 像 藉 度 分 布 的 均匀 程度 ,4SM 值 越 大 ,说 明 纹理 越 粗糙 。 
(5 ) 均 值 
MEAN = Šip, (i) (8-39) 


— 294 — 


第 8 章 ”图 像 特征 描述 与 形态 分 析 


均值 ( MEAN) 较 小 ,说 明 p, (i) 值 集中 于 i=0 附近 ,纹理 较 粗 烟 ,反之 ,p;(i) 远离 原点 分 
布 , 均 值 较 大 ,纹理 较 细致 。 

如 果 图 像 纹 理 有 方向 性 , 则 ps (i) 值 的 分 布 会 随 着 5 方向 适量 的 变化 而 变化 。 可 以 通过 比 
较 不 同方 向 上 p;(i) 的 统计 量 来 分 析 纹 理 的 方向 性 。 例 如 ,一 幅 图 像 在 某 一 方向 上 灰 度 变化 
很 小 , 则 在 该 方向 上 得 到 的 f(x,y) 值 较 小 ,p;(i) 值 多 集中 于 i=0 BREVE, ERAS EIE] AT 
也 较 小 ,4SM 值 较 大 。 

可 见 , 差 分 直方 图 分 析 方 法 不 仅 计算 简单 ,而 且 能 够 反映 纹理 的 空间 组 织 情况 ,克服 了 基 
于 灰 度 直方 图 的 矩 分 析 法 不 能 完整 表达 纹理 空间 域 特征 信息 的 不 足 。 

8.4.3 游程 长 度 分 析 方法 

游程 长 度 统计 方法 同样 可 以 揭示 纹理 的 空间 性 质 。 游 程 在 图 像 中 定义 为 具有 相同 灰 度 的 
在 一 条 直线 上 连续 点 的 集合 。 每 个 游程 中 所 含 点 数 的 数目 则 定义 为 游程 长 度 。 游 程 长 度 统计 
既 反映 纹理 的 粗糙 程度 ,也 反映 纹理 的 方向 性 。 具 有 方向 性 的 纹理 在 某 一 角度 有 较 长 的 游程 。 
同 理 , 粗 糙 的 纹理 也 趋 于 具有 较 长 的 游程 。 长 度 为 ! 个 像素 ,具有 相同 灰 度 刀 方 向 为 0 的 事件 
记 为 (1,f,9) , 令 N(1,f,9) 表 示 大 小 为 W xm 的 图 像 中 游程 (1,f,0) 的 数目 ,Ni 为 所 有 游程 的 
总 数 ,双重 和 式 Ta IU 


T, = E XNGAA 6) (8-40) 

根据 灰 度 游程 得 到 下 列 纹理 特征 信息 。 
(1) 短 游程 优势 

SRE - 1-3. Y NC f, 0) (8-41) 
短 游程 优势 是 图 像 中 短 游 程 的 度量 。 
(2) 长 游程 优势 

LRE -ES ENUS ,0) (8-42) 
长 游程 优势 是 图 像 中 长 游程 的 度量 。 当 行程 长 时 ,LRE 较 大 。 
(3 ) 灰 度 分 布 

GLD - 1-3 t ENC.0)] (8-43) 


NOS 0) UTE O 2718. LORS f, 的 游程 的 总 数 。 灰 度 分 布 是 图 像 中 游程 灰 度 分 布 
的 一 种 度量 。 当 灰 度 行程 等 分 布 时 ,CLD 最 小 ;若菜 些 灰 度 出 现 多 , 即 灰 度 较 均匀 , 则 CLD 大 。 

(4) 游 程 长 度 分 布 
RID - 1- Yt $- NC 6) 1 (8-44) 


ENG, ORRE 0 21181 E KCIREXR f 的 游程 的 总 数 。 长 度 分 布 是 图 像 中 游程 长 度 分 布 
的 一 种 度量 。 如 果 当 灰 度 各 行程 均匀 , 则 RLD 的 值 较 小 ,反之 像素 灰 度 行程 长 短 不 均匀 , 则 
RLD 的 值 较 大 。 
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(5 ) 游程 百分率 
E N NR ; 
NPC Noua Uis 9 (8-45) 


当 所 有 游程 都 较 短 时 ,RPC 的 值 比较 大 。 在 计算 图 像 的 游程 长 度 矩 阵 时 ,一 般 选 取 0 = 
0? 45° .90? 和 135° 四 个 方向 , 灰 度 段 可 根据 需要 来 划分 。 


8.4.4 MIXAGE A 


灰 度 共生 矩阵 是 由 Haralick 提出 的 一 种 用 来 分 析 图 像 纹理 特 征 的 重要 方法 ,是 常用 的 纹 
理 统计 分 析 方 法 之 一 ,从 一 定 程 度 上 刻画 了 邻 域 中 灰 度 值 的 空间 分 布 情况 ,反映 了 纹理 模式 内 
灰 度 的 空间 内 在 联系 ,能 较 精 确 地 反映 纹理 粗糙 程度 和 重复 方向 ,从 而 有 效 地 描述 纹理 。 灰 度 
共生 矩阵 是 建立 在 图 像 的 二 阶 组 合 条 件 概率 密度 函数 的 基础 上 , 即 通过 计算 图 像 中 特定 方向 
和 特定 距离 的 两 像素 间 从 某 一 灰 度 过 渡 到 另 一 灰 度 的 概 
率 , 反 映 图 像 在 方向 间隔、 变化 幅度 及 快慢 上 的 综合 信息 。 

设 Kx,y) 为 一 幅 N x N 的 灰 度 图 像 ,d = (dx ,dy) 是 一 
个 位 移 矢 量 ,其 中 dx 是 行 方向 上 的 位 移 ,dy 是 列 方向 上 的 位 
移 , 为 图 像 的 最 大 灰 度 级 数 。 灰 度 共生 和 矩阵 定义 为 从 7x,y) 
的 灰 度 为 i 的 像素 出 发 ,统计 与 距离 为 6= (dz dy? )* IK 
EAS j 的 像素 同时 出 现 的 概率 P(i,jl1d,0) ,如 图 8-7 所 示 。 
图 87 灰 度 共生 算 阵 的 像素 对 。 数学 表达 式 为 ; 


P(ijld,0) ={(%x,y) lf(x,y) =i, f(x * dx,y +dy) =j} (8-46) 
根据 这 个 定义 , 灰 度 共生 和 矩阵 的 第 ; 行 第 ) 列 元 素 表示 图 像 上 两 个 相距 为 85 方向 为 9、 分 
别 具 有 灰 度 级 i 和 j 的 像素 点 对 出 现 的 次 数 。 其 中 ,(x,y) 是 图 像 中 的 像素 坐标 ,x、y 的 取 值 范 
HIA [0,N-1],i, 的 取 值 范围 为 [0,L 1]. 一般 而 言 ,9 需要 考虑 四 个 方向 :0°、45°、90°、 
135°。 对 于 不 同 的 6, 和 矩阵 元 素 的 定义 如 下 : 
P(i,jld,09) = | (x,y) (x,y) 2i f(x *dx,y +dy) =j,|dx|=d,dy=0|} — (8-47) 
P(ijld,45?) = |(x,y) lf(x,y) =i f(x * dx,y * dy) 2j, (dx 2d,dy = -d)or(dx = -d,dy =d) } 
(8-48) 
P(i jld,90°) = | (x,y) lf(x,y) 2i,f(x *dx,y +dy) 2j,dx =0, |dy| =d} (8-49) 
P(i,jld,135?) = | (x,y) Vf(x,y) =i,f(x +dx,y +dy) =j, 
(dx =d,dy =d)or(dx = -d,dy = -4)| (8-50) 
WA PCi jld, 0) HAIEK ,其 维 数 由 图 像 中 的 灰 度 级 数 决 定 。 若 图 像 的 最 大 灰 度 
级 数 为 L, 则 灰 度 共生 和 矩阵 为 L xL 算 了 泗 。 这 个 和 矩阵 是 距离 和 方向 的 函数 ,在 规定 的 计算 窗口 
或 图 像 区 域内 统计 符合 条 件 的 像素 对 数 。 
空间 灰 度 依赖 矩阵 描述 了 图 像 中 灰 度 值 的 空间 依赖 性 ,反映 了 图 像 灰 度 分 布 关于 方向 、 邻 
域 和 变化 幅度 的 综合 信息 ,但 它 并 不 能 直接 提供 区 别 纹理 的 特性 。 因 此 ,有 必要 进一步 从 灰 度 
共生 和 矩阵 中 提取 描述 图 像 纹 理 的 特征 ,用 来 定量 描述 纹理 特性 。Haralick 定义 了 14 个 能 从 空 
间 灰 度 依 赖 矩阵 上 计算 出 的 二 阶 统计 函数 ,这 些 纹理 特征 中 ,并 不 是 每 一 个 纹理 特征 都 非常 有 
效果 ,而 且 有 些 特征 计算 杂 度 高 。 设 在 取 定 d 0 参数 下 将 灰 度 共生 矩阵 P(i,j1d,9) 归 一 化 记 
一 296 一 





f(x+dx,y+dy) =j 


第 8 章 ”图 像 特征 描述 与 形态 分 析 


3j P(i,jld,0) , 则 最 常用 的 三 种 特征 量 计算 公式 如 下 。 


(1) 对 比 度 
CON = YYP(G ,jld,0) (8-51) 
对 比 度 通 常 可 以 理解 为 图 像 的 清晰 程度 。 在 图 像 中 ,纹理 的 沟 纹 越 深 ,其 对 比 度 越 大 ,图 
像 的 视觉 效果 越 清 晰 。 
(2) 能 量 
ASM = LIPG Jld, 8)? (8-52) 


能 量 是 图 像 灰 度 分 布 均匀 性 的 度量 。 从 图 像 的 整体 来 观察 纹理 较 粗 ,4SM 较 大 , 即 粗 纹 
理 含有 较 多 的 能 量 ;反之 , 细 纹 理 则 ASM 较 小 ,含有 较 少 的 能 量 。 
(3) fili 
ENT - - XXP(.j. 0) log, PCi j1d,6) (8-53) 
Ai Je PH rH REEDER ,纹理 信息 也 属于 图 像 的 信息 。 若 图 像 有 较 多 的 细小 纹理 ， 
则 灰 度 共生 和 矩阵 中 的 数值 近似 相等 ,图 像 的 箭 值 最 大 ; 若 网 像 中 分 布 着 较 少 的 纹理 , 则 该 图 像 
HIRERE. 
共生 方法 描述 了 二 阶 图 像 统计 特征 ,从 一 定 程 度 上 刻画 了 邻 域 中 灰 度 值 的 空间 分 布 情况 ， 
反映 了 纹理 模式 内 灰 度 的 空间 内 在 联系 ,适合 大 量 的 纹理 种 类 。 共 生 方 法 的 良好 性 质 是 对 色 
调 像素 间 的 空间 关系 的 描述 , 且 它 对 于 单调 的 灰 度 级 变换 是 不 变量 。 它 的 缺点 是 不 能 抓 住 纹 
理 基 元 形状 方面 的 信息 ,因而 对 由 大 块 区 域 基 元 组 成 的 纹理 效果 欠 佳 。 对 存储 的 需求 是 其 男 
一 个 大 的 缺点 。 灰 度 级 的 数目 可 以 设 为 32 或 64 ,这 样 就 减 小 了 共生 矩阵 的 大 小 ,但 是 灰 度 级 
精度 的 损失 是 其 产生 的 一 个 负面 影响 。 


8.4.5 纹理 的 结构 分 析 


纹理 结构 分 析 方 法 认为 纹理 是 由 结构 基 元 按 某 种 规则 重复 分 布 所 构成 的 模式 。 为 了 分 析 
纹理 结构 ,必须 提取 结构 基 元 ,并 描述 其 特性 和 分 布 规则 。 一 般 可 做 如 下 两 项 工作 。 

(1) 从 输入 图 像 中 提取 结构 基 元 并 描述 其 特征 。 

(2) 描述 结构 基 元 的 分 布 规则 。 

纹理 基 元 可 以 是 一 个 像素 ,也 可 以 是 若干 灰 度 上 上 比较 一 致 的 像素 点 集合 。 纹 理 的 表达 可 
以 是 多 层次 的 ,如 图 8-8a) 所 示 , 它 可 以 从 像素 或 小 块 纹理 一 层 一 层 地 向 上 拼合 。 当 然 , 基 元 
的 排列 可 有 不 同 规则 ,如 图 8-8b ) 所 示 ,第 一 级 纹理 排列 为 YXY ,第 二 级 排列 为 XYX 等 ,其 中 
X Y 代表 基 元 或 子 纹理 。 

下 面 给 出 一 个 例子 。 如 果 纹 理 基 元 a 表示 一 个 圆 ,如 图 8-9a) 所 示 ,aaa… 表 示 “ 向 右 排 布 
的 圆 " 的 含义 ,假设 有 形 如 S—aS 的 规则 ,这 种 形式 的 规则 表示 字符 S. 可 以 被 重新 写 为 aS( 例 
如 ,三 次 应 用 此 规则 可 生成 字 串 aaa5), 则 规则 $ 一 as 可 以 生成 如 图 8-9b ) 所 示 的 纹理 
图 像 。 

假设 下 一 步 给 这 个 方案 增加 一 些 新 的 规则 .5 一 b4 ,4 一 c4 ,A—c, A—bS , S—a , 3X Hl b KIR 
“向 下 排 布 的 圆 ”,c 表示 “向 左 排 布 的 圆 ” 。 现 在 可 以 生成 一 个 形 如 aaabccbaa 的 串 ,这 个 串 对 
应 一 个 圆 的 3 x3 评价 和 矩阵。 用 相同 的 方式 可 以 很 容易 地 生成 更 大 的 纹理 图 像 模式 。 
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a) b) 


图 8-8 纹理 结构 的 描述 及 排列 


* 


a) 纹 理 基 元 


eq ne 


b) 由 规则 S-*aS 生 成 的 纹理 模式 


Se 
"oap? T 


c) 由 SaS 和 其 他 规则 生成 的 二 维 纹理 模式 
图 8-9 纹理 结构 分 析 图 例 


8.5 ”形态 分 析 


数学 形态 学 ( Mathematical) 是 分 析 几 何 形状 和 结构 的 数学 方法 ,通过 对 目标 图 象 的 形态 变 
换 实现 结构 分 析 和 特征 提取 。 它 建立 在 集合 代数 基础 上 ,用 集合 论 方法 定量 描述 集合 结构 的 
科学 。1985 年 后 , 它 逐 渐 成 为 分 析 图 像 几 何 特征 的 工具 。 腐 人 蚀 、 膨 胀 和 细 化 属于 数学 形态 学 
范畴 内 的 运算 。 

数学 形态 学 是 由 一 组 形态 学 的 代数 运算 子 组 成 。 最 基本 的 形态 学 运算 子 有 :腐蚀 ( Ero- 
sion) \ 膨 胀 ( Delation) ,JF ( Opening) 和 闭 ( Closing) 。 用 这 些 运 算 子 及 其 组 合 来 进行 图 像 形状 
和 结构 的 分 析 及 处 理 , 包 括 图 像 分 割 \ 特 征 抽 取 、 边 界 检测 、 图 像 滤波 、 图 像 增强 和 恢复 等 方面 
的 工作 。 

由 于 形态 学 具有 完备 的 数学 基础 ,为 形态 学 应 用 于 图 像 分析 和 处 理 、 形 态 滤 波 器 的 特性 分 
析 和 系统 设计 芮 定 了 坚实 的 基础 。 尤 其 形态 学 分 析 和 处 理 算法 的 并 行 ,大 大 提高 了 图 像 分 析 
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和 处 理 的 速度 ,近年 来 ,在 图 像 分 析 和 处 理 中 ,形态 学 的 研究 和 应 用 在 国外 得 到 不 断 的 发 展 。 
例如 在 医学 和 生物 学 中 应 用 数学 形态 学 对 细胞 进行 检测 \ 研 究 心 脏 的 运动 过 程 及 对 痊 椎 骨 癌 
图 像 进 行 自 动 数量 描述 ;在 工业 控制 领域 应 用 数学 形态 学 进行 视频 检验 和 电子 线路 特征 分 析 ; 
在 交通 管制 中 检测 汽车 的 运动 情况 等 等 。 另 外 ,数学 形态 学 在 金 相 学 指纹 检测 经济、 地 理 、 
合成 音乐 和 断层 X 光照 等 领域 也 有 良好 的 应 用 前 景 。 

形态 学 的 理论 基础 是 集合 论 。 在 图 像 处 理 中 形态 学 的 集合 代表 着 黑白 和 灰 度 图 像 的 形 
状 , 如 黑白 二 值 图 像 中 所 有 黑色 像素 点 的 集合 组 成 了 此 图 像 的 完全 描述 。 在 一 个 集合 中 ,将 进 
行 形态 变换 的 像素 点 是 被 选择 的 集合 ,而 此 集合 的 补 X" 是 没有 选择 的 集合 。 通 常 选择 的 集 
合 是 图 像 的 前 景 ,而 未 被 选择 的 集合 是 图 像 的 背景 。 

8.5.1 腐蚀 

腐蚀 表示 用 某 种 “ 探 针 ” 即 某 种 形状 的 基 元 或 结构 元 素 对 一 个 图 像 进行 探测 ,以 便 找 出 图 
像 内 部 可 以 放下 该 基 元 的 区 域 。 它 是 一 种 消除 边界 点 ,使 边界 向 内 部 收缩 的 过 程 ,可 以 用 于 消 
除 小 且 无 意义 的 物体 。 腐 蚀 的 实现 同样 是 基于 填充 结构 元 素 的 概念 。 利 用 结构 元 素 填充 的 过 
程 ,取决 于 一 个 基本 的 欧 氏 空间 概念 一 一 平移 。 

将 一 个 集合 4 平移 距离 b 可 以 表示 为 4 +b ,其 定义 为 ; 

A+b=]ļa+blacA]} (8-54) 


从 几何 上 看 ,4 +b 表示 4 沿 矢量 5b 平移 了 一 段 距 离 。 探 测 的 目的 ,就 是 要 标记 出 图 像 内 
部 那些 可 以 将 结构 元 素 填 人 的 位 置 。 
集合 4 被 腐蚀 ,表示 为 46B, 其 定义 为 : 
AQB= la: B*aCA| (8-55) 


其 中 4 称 为 输入 图 像 ,B 称 为 结构 元 素 。 
AOB 由 将 B 平 移 b 仍 包含 在 4 内 的 所 有 点 5 组成。 如 果 将 B 看 作 模 板 , 那 么 ,A48B 则 由 
在 模板 平移 的 过 程 中 ,所 有 可 以 填 入 A 内 部 的 模板 的 原点 组 成 ,如 图 8-10 所 示 。 











图 8-10 腐蚀 类 似 于 收缩 


一 般 而 言 ,如 果 原 点 在 结构 元 素 内 部 , 则 腐蚀 后 的 图 像 为 输入 图 像 的 子 集 , 如 果 原 点 不 在 
结构 元 素 的 内 部 , 则 腐蚀 后 的 图 像 可 能 不 在 输入 图 像 的 内 部 ,但 输出 形状 不 变 ,如 图 8-11 
所 示 。 


= 299 


sisi 











Fd 8-11 腐蚀 不 是 输入 图 像 的 子 图 像 


8.5.2 膨胀 


膨胀 是 腐蚀 运算 的 对 偶 运算 ,可 以 通过 对 补 集 的 腐蚀 来 定义 。 

设 有 一 幅 图 像 4, 将 4 中 所 有 元 素 相对 原点 转 180" , BA (xo, yo) AE - x, - yo) ,所 得 
到 的 新 集合 称 为 4 的 对 称 集合 , 记 为 -4。 

IA 表示 集合 4 的 补 集 , -B RIR B ATERRAR ORRE) MWA, RA ARB 
膨胀 ,表示 为 4 CO B BOE UN: 

AGQBz[4'0( -B)]* (8-56) 

为 了 利用 结构 元 素 B 膨胀 集合 4, 可 将 B 相对 原点 旋转 180? ,得 到 — B, AIH -B X} AF 

进行 腐蚀 ,腐蚀 结果 的 补 集 就 是 所 求 的 结果 ,如 图 8-12 所 示 。 


y 





图 8-12 AH ERK 
腐蚀 具有 收缩 图 像 的 作用 ,膨胀 具有 扩大 图 象 的 作用 。 利 用 腐蚀 和 膨胀 运算 的 特点 可 以 
完成 一 些 特殊 的 图 像 处 理 。 选 择 不 同 的 结构 对 图 像 进行 腐蚀 运算 ,可 以 不 同 程度 的 去 除 噪声 ， 
但 对 图 像 的 形状 也 有 不 同 程度 的 改变 。 


8.5.3 ”腐蚀 和 脱 胀 的 滤波 性 质 


数学 形态 学 中 的 腐蚀 和 膨胀 运算 与 基本 的 集合 运算 之 间 存 在 着 一 种 代数 运算 对 应 关系 。 
下 面 讨论 与 形态 学 滤波 有 关 的 一 些 性 质 。 
(1) 平 移 不 变性 
腐蚀 和 膨胀 都 具有 平移 不 变性 。 对 于 膨胀 ,意味 着 ,首先 平移 图 像 , 然 后 利用 一 个 给 定 的 
结构 元 素 对 其 做 膨胀 处 理 , 和 先 用 一 个 给 定 的 结构 元 素 对 图 像 做 膨胀 处 理 ,然后 做 平移 处 理 所 
得 结果 是 一 样 的 , 即 
(A*x)O Bz(AQB) *x (8-57) 
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对 于 腐蚀 ,平移 不 变性 具有 下 面 的 形式 : 


(A+x)QB=(A0B) +x (8-58) 
在 考虑 平移 不 变性 的 时 候 ,必须 注意 ,平移 不 变性 针对 的 是 平移 图 像 ,而 不 是 结构 元 素 。 


(2) 递 增 性 
腐蚀 和 膨胀 都 具有 递增 性 ,如 果 4, 为 4, 的 子 集 , 则 A, OO B OS A, 四 了 的 子 集 ,4,9B 为 
AOB 的 子 集 。 另 外 ,腐蚀 的 递增 性 是 相对 结构 元 素 及 输入 图 像 的 次 序 , 即 包含 关系 而 言 的 。 
如 果 4 是 一 个 固定 的 图 像 ,B, 是 B, 的 一 个 子 集 ,那么 ,B, EB 更 容易 填 人 4 的 内 部 ,因而 ， 
AOB, 包含 49B，。 
(3) 对偶 性 
前 面 指出 ,膨胀 是 腐蚀 的 对 偶 运 算 。 因 为 膨胀 可 以 通过 对 图 像 的 补 集 作 腐蚀 运算 求 得 , 腐 
蚀 也 可 以 通过 对 图 像 的 补 集 作 膨胀 运算 求 得 , 即 
AG B - [4*0 B]^ (8-59) 
AOB - [A^ B]^ (8-60) 
8.5.4 PZE 
在 形态 学 图 像 处 理 中 ,除了 腐蚀 和 膨胀 两 种 基本 运算 外 ,还 有 两 种 由 腐蚀 和 膨胀 定义 的 运 
算 , 即 开 运算 和 闭 运 算 。 这 两 种 运算 是 数学 形态 学 中 最 主要 的 运算 或 变换 。 从 结构 元 素 填 充 
的 角度 看 ,具有 更 为 直观 的 几何 形式 ,同时 提供 了 一 种 手段 ,可 以 在 复杂 的 图 像 中 选择 有 意义 
的 子 图 像 。 
假定 A 仍 为 输入 图 像 ,B 为 结构 元 素 ,利用 B 对 4 作 开 运算 ,用 4。B 表示 ,其 定义 为 ; 
4oB=(498) 四 有 (8-61) 
因此 , 开 运算 实际 上 是 4 先 被 B 腐蚀 ,然后 再 被 B 膨胀 的 结果 。 开 运算 通常 用 来 消除 小 
对 象 物 .在 纤细 点 处 分 离 物体 .平滑 较 大 物体 边界 的 同时 并 不 明显 的 改变 其 体积 。 图 8-13 是 
利用 圆 盘 对 矩形 开 运 算 的 例子 。 





图 8-13 圆 盘 对 输入 图 像 开 运算 的 结果 


8.5.5 Has 
闭 运算 是 开 运 算 的 对 偶 运 算 , 定 义 为 先 做 膨胀 运算 然后 再 做 腐蚀 运算 。 利 用 B 对 A 作 闭 
运算 表示 为 4 B, 其 定义 为 : l 
4.B=[4 由 (-B)]9(-B) (8-62) 
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BIH -B xt A 进行 膨胀 ,将 其 结果 再 利用 -B 进行 腐蚀 。 闭 运算 通常 用 来 填充 目标 内 细 
小 孔洞 .连接 断 开 的 邻近 目标 ,平滑 其 边界 的 同时 并 不 明显 改变 其 面积 。 岁 8-14 描述 了 闭 运 
算 的 过 程 及 结果 。 显 然 , 用 闭 运算 对 图 像 的 外 部 做 滤波 ,仅仅 磨 光 了 凸 向 图 像 内 部 的 边 角 。 


nant 


AQ (-B) A9B 
图 8-14 圆 盘 对 输入 图 像 进 行 闭 运 算 


显然 ,用 闭 运 算 对 图 形 的 外 部 做 滤波 ,仅仅 磨 光 了 凸 向 图 像 内 部 的 边 角 。 
8.5.6 ” 开 、 闭 运算 的 滤波 性 质 
经 过 上 面 的 讨论 ,我 们 可 以 得 出 开 闭 运算 的 滤波 性 质 。 


(1) 平 移 不 变性 
(A+x)°B=(A°B) +x (8-63) 
(A+x) .B=(A.B)+x (8-64) 
(2) 递 增 性 
A 
A, °BCA,°B (8-65) 
A, * BCA, - B (8-66) 
(3) 延 伸 性 
开 运算 是 非 延 伸 的 ,4。8 是 4 的 子 集 ; 而 闭 运 算是 延伸 的 ,4 是 4 B 的 子 集 。 由 此 可 得 ， 
AeBCACA- B (8-67) 
(4) XE E 


在 对 一 个 图 像 4 用 结构 元 素 进行 开 运算 后 , 若 再 用 同一 结构 元 素 进行 又 一 次 开 运算 , 则 
所 得 结果 不 变 ,这 种 性 质 叫 做 震 等 性 。 同 样 , 闭 运 算 也 具有 寡 等 性 。 


AoBoB zAoB (8-68) 
A*B-*BzA- B (8-69) 
(5) 对 偶 性 
开 、 闭 运算 互 为 对 偶 运 算 : 
AB=(A°.B)° (8-70) 
A* Bz (A09 B)* (8-71) 
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8.5.7 ”形态 分 析 的 实现 


在 本 节 中 我 们 将 结合 上 述 的 理论 给 出 具体 的 实现 方法 ,包括 Matlab 的 仿真 实现 以 及 基于 C 语 
言 的 DM642 代码 ,以 便 读者 深入 了 解数 学 形态 学 的 基本 概念 及 其 特点 ,掌握 其 实现 方法 。 
(1) Matlab 实现 
中 图 像 腐蚀 M 文件 
A =imread( 'G; \changan. bmp!) ; 
[ height, width] = size( A) ; 
B2[1,0,1,0,0,0;1,0,1]; 
B =uint8 (B); 
C = zeros( height , width ) ; 
C =uint8 (C); 
for i =2 ;height - 1 
for j 22:width - 1 
templ zi; 
temp2 =j; 
6(1,]):2255; 
for mz1:3 
for n z1:3 
if B( m,n) » -1 
continue ; 
end 
temp3 =templ + (2 - m); 
temp4 = temp2 + (2 - n); 
if A( temp3 ,temp4) «128 
C(i,j) 20; 
break ; 
end 
end 
end 
end 
end 
figure(1) ; 
imshow( A); 
title(' 原始 图 像 ') ; 
figure(2) ; 
imshow( C); 
title( ' 腐蚀 处 理 图 像 ') ; 
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a) 原始 图 像 b) 腐蚀 处 理 图 像 


图 8-15 图像 腐蚀 结果 


2 图像 膨胀 的 M 文件 
A = imread ( 'G ; \changan. bmp' ); 
' height, width | = size( A) ; 
Bz/1,0,1;0,0,0;1,0,1 
B = uint8( B) ; 
C = zeros( height ,width ) 
C - uint&8( 
for i Z2:height - 1 
for j 22:width - 1 
templ =i; 
temp2 =j; 
C(1,j) =0; 
for mz1:3 
for n z1:3 
if B(m,n) 2» -1 
continue ; 
end 
temp3 2 templ (2 - m); 
temp4 = temp2 + (2 - n) ; 
if A( temp3 ,temp4) > 128 
C(1,]).2255; 
break ; 
end 
end 


end 
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end 
end 
figure(1) ; 
imshow( A) ; 
title(' 原始 图 像 ) ; 
figure(2) ; 
imshow( C); 
title( ' 膨胀 处 理 结果 图 ') ; 
图 像 膨胀 Matlab 仿真 结果 如 图 8-16 所 示 


长 安 大 学 长 安 大 学 


电子 与 控制 工程 学 院 电子 与 控制 工程 学 院 





a) 原始 图 像 b) 膨胀 处 理 图 像 


图 8-16 ”膨胀 处 理 图 像 


(图像 开 运算 的 M 文件 
A = imread ( 'G ; \circles. bmp') ; 
[ height, width ] 2 size( A); 
Bs[1,0,1;0,0,0;:1,0,1]; 
B zuint8( B) ; 
C = zeros( height ,width ) ; 
C =uint8 (C); 
D = zeros( height ,width ) ; 
D =uint8( D); 
for i =2 : height - 1 % 腐蚀 
for j =2:width - 1 
templ =i; 
temp2 =j; 
C(1,j) 2255; 
for m 21:3 
for n=1:3 
f B(mm) =3 
continue ; 
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end 
end 
end 
end 
for i Z2;height - 1 


end 
temp3 = templ + (2 - m); 
temp4 = temp2 + (2 - n); 
if A( temp3 ,temp4) «128 
C(i,j) 20; 
break ; 


end 


% 膨胀 


for j =2:width -1 


templ zi; 


temp2 =j; 
D(i,j) =0; 


for m=1 


:3 


for n=1:3 


end 
end 
end 
end 
figure( 1) ; 
imshow( A) ; 


if B(m,n) == 
continue ; 
end 
temp3 = templ + (2 - m); 
temp4 = temp2 + (2 - n) ; 
if C( temp3 ,temp4) > 128 
D(i,j) 2255; 
break ; 


end 


title(' 原始 图 像 ') ; 


figure(2) ; 
imshow( C); 


title (' 腐蚀 图 像 ') ; 


figure(3) ; 
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imshow( D) ; 
title(' FZR P; 
图 像 开 运算 Matlab 仿真 结果 如 图 8-17 Bron o 





a) 原始 图 像 


K 8-17 开 运 算 结 果 


(@ 图 像 闭 运算 M 文件 
A 2 imread( 'C ; \circles. bmp) ; 
[ height, width | = size( A) ; 
B2[1,0,1;0,0,0;1,0,1]; 
B =uint8 (B); 
C = zeros( height , width ) ; 
C =uint8 (C); 
D = zeros ( height , width ) ; 
D - uint8( D) ; 
for i 22;height - 1 和 膨胀 
for j =2:width - 1 
templ =i; 
temp2 =j; 
C Css 
for mz1:3 
fornz1:3 
ii B(m,n)- zl 
continue ; 
end 
temp3 = templ + (2 - m); 
temp4 = temp2 + (2 - n) ; 


if A( temp3 ,temp4) > 128 


第 8 章 


b) 开 运算 图 像 


图 像 特 征 描述 
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Q(1,]) 2255; 
break ; 
end 
end 
end 
end 
end 
fori-2;height -1 % 腐 蚀 
for j =2:width - 1 
templ =i; 
temp2 =j; 
D(i,j) 2255; 
for m 21:3 
fornz1:3 
if B(m,n) == 
continue; 
end 
temp3 = templ + (2 - m); 
temp4 = temp2 + (2 -n); 
if C( temp3 ,temp4) «128 


D(i,j) 20; 
break ; 
end 
end 
end 
end 
end 
figure(1) ; 
imshow( A); 


title(' 原始 图 像 s 

figure(2) ; 

imshow( C); 

title(' 膨胀 图 像 ') ; 

figure(3) ; 

imshow( D); 

title(' Has SERRE ') ; 

图 像 闭 运算 的 Matlab 仿真 结果 如 图 8-18 所 示 。 
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a) 原始 图 像 b) 闭 运 算 图 像 


图 8-18 闭 运 算 结果 
(2) 基 于 DM642 系统 的 程序 
这 里 基于 TMS320 DM642 DSP 处 理 平台 给 出 了 数学 形态 学 算法 的 C 语言 实现 
DD) 图像 腐蚀 DM642 程序 
#include < stdio. h > 
#include < stdlib. h > 
#include < math. h > 
#define width 512 
#define height 350 
#pragma DATA, SECTION( input, ' 
spragma DATA, SECTION ( output, ". my, sect) 


.my sect ) 


unsigned char input[ height | | width | ; 
unsigned char output| height | | width | ; 
void ReadImage( char * cFileName) ; 
void bmpDataPart( FILE * fpbmp) ; 
void erosion( ) ; 


void main( ) 


/* 图 像 */ 


Hao H 
ReadImage( G:\changan. bmp 


Jis 
erosion( ) ; 


while (1); 
void ReadImage( char * cFileName) 


FILE = fp; 
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if (fp =fopen( cFileName , rb") ) 
| 2 
bmpDataPart( fp) ; 
fclose( fp) ; 


| 
void bmpDataPart( FILE * fpbmp) 
| 
int i, j 20; 
unsigned char * pix = NULL; 
fseek( fpbmp, 1078L, SEEK SET) ; 
pix = ( unsigned char * ) malloc ( width ) ; 
for(j 20;j < height;j + +) 
| 
fread( pix, 1, width , fpbmp) ; 
for(i =0;i < width;i- +) 
| 
input[ height -1 -j][i] =pixli]; 


| 
void erosion( ) 
| 
int i,j; 
int m,n; 
unsigned char B[3][3] 2111,0,1/,10,0,0],11,0,1] ] ; 
for(i2l;i«height - 1;i- +) 
| 
for(j 20;j < width;j + +) 
| 
output[i][j] 2255; 
for(m=0;m <3;m + +) 
| 
for(nz0;n«3;n- +) 
| 
ifí(B[m][n] == I) 
| 
continue; 
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if(input[i-1 -m][j*1 -m] < 128) 


output[ i] [j] 20; 





@ 图 像 膨 胀 的 DM642 程序 
stinclude < stdio. h > 
sinclude < stdlib. h > 
sinclude < math. h > 
#define width 512 
#define height 350 
#pragma DATA, SECTION( input , "!. my, sect") 
spragma DATA, SECTION ( output , ". my, sect") 
unsigned char input| height | | width | ; 
unsigned char output | height ] [ width ] ; 
void ReadImage( char * cFileName ) ; 
void bmpDataPart( FILE * fpbmp ) ; 
void delation( ) ; 
void main( ) 
| 
/* 图 像 */ 

ReadImage( " G ; \changan. bmp" ) ; 

delation( ) ; 

while (1); 
| 
void ReadImage( char * cFileName) 
| 

FILE *fp; 

if ( fp 2 fopen( cFileName , rb") ) 
| 
bmpDataPart( fp) ; 
fclose( fp) ; 
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二 
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| 
void bmpDataPart( FILE * fpbmp) - 
| 
int i, j 20; 
unsigned char * pix = NULL; 
fseek( fpbmp, 1078L, SEEK SET) ; 
pix = ( unsigned char * ) malloc ( width ) ; 
for(j 20;j « height;j + +) 
| 
fread( pix, 1, width , fpbmp) ; 
for(i =0;i < width;i + 4) 
| 
input[ height -1 -j][i]  =pixļi]; 


| 
void delation( ) 
| 
int i,j; 
int m,n; 
unsigned char B[ 3][3] 2111,0,1/,10,0,0/,11,0,1] | ; 
for(i2l;i«height - 1;i * +) 
| 
for(j =0;j < width;j + +) 
| 
output[ i] [j] 20; 
for(m 20;m <3;m+ +) 
| 
for(n=0;n <3;n+ +) 
| 
ifíB[m][n] == 1) 
| 
continue ; 
| 
if(input[i+1 -m][j*1-m] > 128) 
| 
output[ i] [j] =255 ; 
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(图像 开 运算 的 DM642 程序 
#include < stdio. h > 
#include < stdlib. h > 
#include < math. h > 
#define width 512 
#define height 350 
spragma DATA, SECTION( input , ". my. sect") 
#pragma DATA, SECTION ( output , ". my, sect") 
*pragma DATA, SECTION( temp, "', my. sect") 
unsigned char input| height | [ width ] ; 
unsigned char output[ height | [ width | ; 
unsigned char temp| height | [ width | ; 
void ReadImage( char * cFileName ) ; 
void bmpDataPart( FILE * fpbmp) ; 
void opening( ) ; 
void main( ) 
| 
/* KUR */ 

ReadImage( "'G: \changan. bmp") ; 

opening( ) ; 

while (1); 
| 
void ReadImage( char * cFileName ) 
| 

FILE * fp; 

if ( fp = fopen( cFileName , rb") ) 
| 
bmpDataPart( fp) ; 
fclose( fp) ; 


| 
void bmpDataPart( FILE * fpbmp) 
| 
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int i, j =0; 
unsigned char * pix = NULL; 
fseek (fpbmp, 1078L, SEEK SET) ; 
pix = ( unsigned char * ) malloc ( width ) ; 
for( j 20;j < height;j + +) 
| 
fread( pix, 1, width , fpbmp) ; 
for(i =0;i < width;i + +) 
| 
input[ height - 1 -j] [i]  =pix[i]; 


void opening( ) 
| 
int i,j; 
int m,n; 
unsigned char B[3][3] 2111,0,1/,10,0,0/,11,0,1]] ; 
fo(isl;i«height —1;i +) /腐蚀 
| 
for(j =0;j <width;j + +) 
| 
temp[ i][j] =255; 
for(m 20;m «3;m + +) 
| 
for(n=0;n<3;n+ +) 
| 
ifíB[m][n] 22 1) 
| 
continue; 
| 
if(input[i+1 -m][j*1-m] < 128) 
| 
temp[ i][j] =0; 
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| 
i 


for(i=1;i<height-1;i+ +) /膨胀 
| 
for(j =0;j<width;j++) 
| 
output[ i][j] 20; 
for( m 20;m «3;m * +) 
| 
for(nz0;n«3;n« +) 
| 
ifCB[m][n] == 1) 
| 


continue ; 


| 
j 


temei enisi =o aa 
| 
output[ i] [j] 2255; 


@ 图 像 闭 运 算 的 DM642 程序 

#include < stdio. h > 

#include < stdlib. h > 

#include < math. h > 

#define width 512 

#define height 350 

#pragma DATA, SECTION( input, "". my, sect") 
stpragma DATA, SECTION( output, ". my, sect") 
spragma DATA. SECTION( temp, ". my. sect") 
unsigned char input| height | [ width | ; 
unsigned char output[ height | | width | ; 
unsigned char temp| height | [ width | ; 

void ReadImage( char * cFileName ) ; 

void bmpDataPart( FILE * fpbmp ) ; 


void closing( ) ; 
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AN 


图 像 处 理 与 机 器 视觉 


void main( ) 


| 
/* 图 像 */ 
ReadImage ( ''G ; \changan. bmp") ; 
closing( ) ; 
while (1) ; 
| 
void ReadImage( char * cFileName) 
| 
FILE * fp; 
if ( fp 2 fopen( cFileName , rb") ) 


J 
l 


bmpDataPart ( fp ) ; 
fclose( fp) ; 


| 

void bmpDataPart( FILE * fpbmp) 

| 
int i, j 20; 
unsigned char * pix = NULL; 
fseek(fpbmp, 1078L, SEEK SET) ; 
pix = ( unsigned char * ) malloc( width ) ; 
for( j z0;j < height ; j Tec ) 


| 
| 


fread( pix, 1, width , fpbmp) ; 
for(i =0;i < width;i + +) 
| 
input[ height -1 -j] [i] —X-pix[i]; 


| 

void closing( ) 

| 
int 1,]; 
int m,n; 
unsigned char B[3] [3] 2111,0,1/,10,0,0],11,0,1] |]; 
fo(isl;i«height -1;i+ +) /膨胀 
| 
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for(j =0;j<width;j+ +) 
| 
temp[i][j] 20; 
for(m 0;m <3;m + +) 
| 
for(n =0;n <3;n+ +) 
| 
ifí«B[m][n] == 1) 
| 
continue; 
| 
if(input[i+1-m][j+1-m] > 128) 


| 
temp[ i][j] 2255; 


for(i=1;i<height -1;i4 +) /腐蚀 
| 
for(j 20;j « width;j + +) 
| 
output[ i][j] 2255; 
for( m 20;m «3;m + +) 
| 
for(n 20;n <3;n+ +) 
| 
ifíB[m][n] == 1) 
| 


continue; 
if(temp[i-1-mj][j*1 -m] < 128) 


output[ i] [j] 20; 





| 
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DCCS 仿真 结果 


选择 CCS 设置 中 的 Tools 一 Image Analyzer 调 出 图 像 窗口 ,右键 单 击 图 像 窗 口 选择 


Properties 进 行 图 像 显示 配置 ,设置 如 图 8-19 、 图 8-20 所 示 


Image |üL. Properties . 





图 像 查看 设置 
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0) 膨胀 结果 d) 开 运 算 结果 
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e) 闭 运算 结果 


图 8-220 DM642 处 理 结果 


8.6 ”本 章 小 结 


图 像 描 述 和 形态 学 处 理 是 获取 图 像 中 目标 信息 ,分 析 目 标 信息 的 重要 步 又 ,恰当 的 图 像 描 
述 和 形态 学 处 理 能 够 便于 图 像 处 理 系统 对 图 像 中 有 效 信息 的 后 续 处 理 。 本 章 着 重 介绍 了 图 像 
灰 度 描述 .边界 描述 区域 描述 和 纹理 描述 的 几 种 常见 方法 。 在 图 像 形态 学 处 理 部 分 ,以 腐蚀 
和 膨胀 运算 为 基础 ,介绍 了 图 像 形态 学 处 理 的 基本 思想 和 方法 ,并 给 出 了 部 分 参考 案例 供 读者 


学 习 s 
enamel 


1. 图 像 都 有 哪些 特征 ? 简要 说 明 这 些 特征 ,它们 在 图 像 分 析 中 有 何 用 途 ? 

2. 什 么 是 傅立叶 描述 ? 它 有 何 特点 ? 试 编写 计算 图 像 区 域 傅立叶 描述 的 程序 。 

3. 分 别 用 方形 和 圆 形 两 种 结构 元 素 实现 二 值 图 像 的 腐蚀 运算 ,改变 结构 元 素 大 小 ,观察 分 
析 腐 蚀 结 果 。 

4. 已 知 一 幅 4*4, 灰 度 级 为 4 的 数字 图 像 如 下 图 所 示 , 取 d=1, 分 别 求 9=0°、45°、90°、 
135? RE 45 X REEE p(i,j1d,0) ,分 析 它 在 不 同方 向 上 的 纹理 分 布 情况 ,并 计算 图 像 的 三 个 
纹理 特征 量 。 





t2 P GOG c 
t2 l2 0 Oc 
Ww N mA — 
uU V = — 


5. 编程 求 二 值 图 像 的 形态 边界 。 


起 = 
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9.1 前 言 


图 像 压缩 编码 技术 是 在 保证 图 像 质 量 的 前 提 下 ,用 尽 可 能 少 的 比特 数 来 表示 数字 图 像 中 
所 包含 信息 的 技术 。 从 信息 论 的 角度 来 看 ,又 称 为 “ 信 源 编码 ” 。 图 像 信息 之 所 以 能 够 压缩 ， 
HE T Jtt RR PEERKE f CAS y ur S IER V 8 [8] JA fe s M TAS ETER Lf 
结构 元 余 视觉 元 余 和 知识 元 余 等 。 图 像 编码 是 在 信道 容量 有 限 的 条 件 下 ,解决 由 于 图 像 数据 
量 庞大 带 来 的 存储 和 传输 困难 等 问题 的 主要 措施 ,在 军事 和 民用 的 许多 领域 中 都 具有 重要 的 
研究 价值 。 本 章 将 对 图 像 压 缩编 码 的 基本 知识 常见 的 图 像 压缩 编码 方式 及 静止 图 像 压 缩编 
人 码 实例 进行 详细 阐述 。 


9.2 ”图像 压缩 基础 知识 





9.2.1 图 像 压缩 原理 


数字 化 后 的 图 像 数 据 量 十 分 庞大 ,这 给 存储 器 的 存储 .通信 干线 信道 的 带宽 和 图 像 处理 系 
统 带 来 巨大 的 挑战 。 例 如 ,一 幅 分 辩 率 为 640 x480 的 24 位 真 彩色 图 像 的 数据 量 约 为 900KB， 
fr IGB 的 硬盘 中 只 能 存储 1000 多 幅 这 样 的 静止 图 像 画 面 。 以 一 般 彩 色 电 视 信 号 为 例 , 若 各 
分 量 均 被 数字 化 为 8 个 比特 , 则 数据 量 约 为 100Mbys ,因而 采用 一 个 容量 为 1CB( =1000MB = 
8000Mb) 的 CD—ROM ( 只 读 光 盘 ) 仅 能 存 约 1min 的 原始 数据 ( 每 字 节 后 带 2 位 校 验 位 ) 。 单 
纯 的 增加 存储 器 容量 增加 带宽 ,提高 计算 机 硬件 配置 将 会 导致 图 像 传输 、 图 像 存 储 的 困难 和 
成 本 急剧 增高 ,这 是 不 现实 的 。 研 究 发 现 , 图 像 数据 表示 中 存在 较 大 的 元 余 。 这 给 图 像 压 缩编 
码 提供 了 理论 依据 。 

图 像 压缩 实际 上 就 是 在 保证 重建 图 像 质量 的 前 提 下 ,用 尽 可 能 少 的 数据 来 描述 图 像 所 包 
含 的 信息 。 在 信息 论 上 ,图 像 压缩 属于 信 源 编码 ,利用 了 原始 图 像 中 存在 的 大 量 宛 余 如 空间 元 
R .时 间 元 余 和 编码 元 余 等 。 

空间 宛 余 : 空 间 宛 余 又 称 像素 间 宛 余 或 几何 元 余 , 是 指 视频 图 像 中 各 像素 的 值 可 以 比较 方 
便 的 由 临近 像素 的 值 预测 或 者 估计 出 来 ,每 个 像素 中 所 含 的 独立 信息 较 少 。 即 图 像 中 灰 度 、 色 
彩 相近 的 块 之 间 的 联系 。 

时 间 宛 余 : 时 间 元 余 又 称 时 域 元 余 , 是 指 视频 图 像 由 于 每 秒 连续 播放 数 帧 图 像 , 在 图 像 变 
化 缓慢 时 ,这 些 相 邻 帧 的 图 像 之 间 一 般 差 别 很 小 ,存在 着 较 大 的 相关 性 。 这 种 相关 性 就 表现 为 
时 间 宛 余 。 
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编码 宛 余 :为 表达 图 像 数据 需要 使 用 一 系列 符号 (如 数字 和 字母 等 ) ,这 些 符 号 的 集合 就 
构成 一 个 码 本 。 用 码 本 中 的 符号 根据 一 定 的 规则 来 表达 图 像 数据 就 是 对 图 像 编 码 。 对 同一 幅 
图 像 使 用 不 同 的 编码 方法 ,编码 的 长 度 可 能 不 同 ,会 产生 与 编码 方法 有 关 的 元 余 。 例 如 采用 固 
定 8 位 长 编码 来 控制 每 个 像素 可 能 的 256 种 颜色 变化 。 实 际 的 图 像 或 图 像 中 有 些 部 分 往往 并 
没有 这 样 多 的 颜色 层次 ,也 就 是 并 非 所 有 像素 点 都 需要 8 位 长 编码 来 表示 ,这 种 元 余 就 称 为 纺 
BIR 


9.2.2 图像 压缩 编码 的 分 类 


图 像 压 缩编 码 有 多 种 方法 ,这 些 方法 大 致 可 以 分 成 两 类 ;无 失真 编码 (lossless coding) 和 限 失 
真 编码 (lossy coding) 。 无 失真 编码 是 指 压缩 与 解压 缩 都 没有 任何 数据 损失 的 技术 ,解压 图 像 完 
全 等 于 原 图 像 ,达到 理想 状态 。 对 于 某 些 情形 ,如 数据 库 文件 、 源 程序 或 可 执行 文件 代码 ,无 失真 
压缩 显然 是 必须 的 。 但 是 ,无 失真 压缩 的 主要 缺点 是 不 能 达到 很 高 的 压缩 比 (通常 2:1 左右 ) 。 
对 于 大 多 数 图 像 ,无 失真 压缩 技术 可 以 达到 的 最 高 压缩 比 也 只 有 10: 1。 无 失真 编码 是 利用 图 像 
的 统计 特性 进行 数据 压缩 的 方法 ,主要 思想 是 对 图 像 数据 中 出 现 概率 大 的 字符 以 短 字 节 编 码 ,对 
图 像 数 据 中 出 现 概率 小 的 字符 以 长 字 节 编码 。 在 无 失真 编码 方法 中 , Huffman 编码 和 行程 编码 
( run-length ) 是 两 种 较 有 效 的 编码 方法 。 有 限 失真 压缩 技术 的 重 构图 像 仅 仅 看 起 来 与 原 图 像 
相像 .实际 并 不 是 原 图 像 的 准确 复制 。 这 方面 的 编码 方法 有 很 多 ,最 著名 的 有 预测 编码 (也 称 
DPCM) ,变换 编码 、 矢 量 量化 编码 小波 与 子 带 编 码 .3D 模型 编码 以 及 分 形 编码 等 。 

9.2.3 ”图像 压缩 编码 的 流程 


前 一 节 中 已 经 介绍 过 图 像 中 存在 信息 元 余 , 而 图 像 奈 缩编 码 的 主要 目的 就 是 减少 这 些 宛 
余 信 息 。 典 型 的 图 像 信 源 编码 的 过 程 如 图 9-1 所 示 。 


映射 器 量化 器 符合 编码 器 
i (Symbol 编码 输出 
foy n) Vete Raine 


图 9-1 典型 的 图 像 信 源 编码 过 程 

整个 编码 过 程 一 般 由 以 下 三 个 步骤 组 成 ， 

(1) BUR 

映射 器 把 f(x,y) 或 者 f(x,y,z) 进 行 某 种 映射 ,以 此 来 前 弱 图 像 信 号 内 部 的 相关 性 ,降低 
空间 和 时 间 元 余 。 其 中 ,f(x,y) 指 静止 图 像 ,f(x,y,z) 是 视频 应 用 。 

(2) 量 化 

量化 器 根据 预先 设 定 的 对 图 像 质量 的 要 求 ,来 降低 映射 器 输出 的 精度 。 采 用 复合 主观 视 
觉 特性 的 量化 来 实现 ,这 一 操作 是 不 可 逆 的 ,在 无 损 压 缩 中 这 一 步 需 略 去 。 

(3 ) 符 号 编码 

利用 统计 编码 消除 最 终 被 编码 的 符号 所 含 的 统计 宛 余 度 。 经 过 以 上 三 个 步骤 ,输入 图 像 
中 的 三 种 元 余 都 被 去 除了 。 

解码 过 程 则 包括 符号 解码 器 和 北 映 射 器 ,它们 以 相反 的 顺序 执行 编码 过 程 中 的 符号 编码 
人 句 和 映射 器 的 反 操作 。 
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9.2.4 图 像 压缩 编码 的 评价 指标 _ 

评价 图 像 压缩 性 能 ,并 不 是 数据 被 压缩 得 越 小 越 好 ,常常 需要 考虑 以 下 3 个 关键 参数 。 

1. 压缩 量 或 压缩 比 

通常 是 压缩 过 程 中 输入 数据 量 与 输出 数据 量 之 比 ,但 这 种 度量 方法 还 必须 指明 输入 输出 
的 显示 形式 ,否则 是 不 可 靠 的 。 例 如 ,压缩 系统 的 输入 可 能 是 512 x 480 的 分 辩 率 ,每 像素 24 
位 ,输入 数据 是 737280 字 节 。 而 车 输出 为 15000 个 字 节 的 位 流 , 则 压缩 比 大 约 为 49:1, 但 如 
果 输 出 图 像 只 有 256 x 240 个 像素 ,其 分 辩 率 只 有 输入 图 像 的 1/4, 因而 ,在 分 辩 率 是 相等 的 情 
况 下 ,压缩 比 应 为 12:1。 因 此 ,衡量 压缩 量 的 一 个 更 好 的 方法 是 在 压缩 位 流 中 确定 每 个 显示 
像素 所 需 的 位 数 。 如 在 上 述 例子 中 输入 为 每 像素 24 位 ,输出 的 15000 字 节 位 流 是 要 再 现 一 个 
256 x 240 像素 的 图 像 , 则 压缩 结果 定义 为 :(15000 x8 ) 15000M /(256 x240) =2 位 ,压缩 比 
3r 12:10, 

2. 图 像 质 量 

图 像 质量 与 压缩 的 类 型 有 关 。 压 缩 方法 可 以 分 为 无 损 压 缩 和 有 损 压缩 。 无 损 压缩 是 指 压 
缩 及 解压 过 程 中 没有 损失 原来 的 图 像 信息 ,所 以 对 无 损 系统 不 必 担 心 图 像 质 量 。 有 损 压缩 则 
要 对 原来 图 像 作 一 些 改变 ,这 样 就 使 得 压缩 前 、 后 的 图 像 不 完全 相同 ,但 人 眼 难 以 察觉 。 对 有 
损 压缩 结果 的 评价 方式 主要 是 主观 评价 。 

3. 压缩 和 解压 的 速度 

在 许多 应 用 中 ,压缩 和 解压 将 在 不 同时 间 、 地 点 ,不 同 的 系统 中 ,因而 必须 分 别 地 评价 压缩 
和 解压 速度 。 在 存储 回放 应 用 中 ,解压 速度 比 压缩 速度 更 重要 ,因为 压缩 只 是 一 次 ,而 解压 则 
面 对 大 多 数 用 户 的 实时 需要 。 但 在 采集 摄像 机 的 实时 动态 视频 时 ,对 动态 视频 的 压缩 速度 要 
求 较 快 。 无 论 哪 种 情形 ,压缩 和 解压 速度 都 比较 易于 规定 和 测量 。 除 了 这 些 指 标 之 外 ,还 要 考 
虑 软件 和 硬件 的 开销 。 有 些 数 据 的 压缩 和 解压 可 以 在 标准 个 人 电脑 硬件 条 件 下 使 用 软件 实 
现 , 有 些 则 因为 算法 的 复杂 和 质量 要 求 高 而 必须 采用 专门 的 硬件 。 


9.3 ”预测 编码 


9.3.1 预测 编码 的 基本 原理 


预测 编码 是 根据 数据 在 时 间 和 空间 上 的 相关 性 ,利用 已 有 的 样本 得 到 新 样本 的 预测 值 ,将 
样本 的 实际 值 与 其 预测 值 相 减 得 到 误差 值 , 再 对 误差 值 进行 编码 ,降低 传输 码 率 ,达到 压缩 的 
目的 。 具 体 编码 过 程 可 以 根据 相 邻 像素 点 之 间 的 相关 性 ,用 相 邻 像素 点 预测 当前 像素 点 得 到 
当前 像素 点 的 预测 值 ,然后 用 当前 点 的 实际 像素 值 减 去 其 预测 值得 到 误差 值 , 对 其 预测 误差 进 
行 编码 的 过 程 。 预 测 编码 作为 图 像 无 损 压 缩 的 基本 理论 框架 ,在 预测 编码 的 算法 中 ,将 整个 预 
测 编码 过 程 分 为 去 相关 和 编码 两 个 部 分 。 

(1) 去 相关 :去 相关 又 称 为 解 相关 ,根据 字面 意思 可 以 理解 为 去 除 或 者 降低 像素 点 之 间 的 
相关 性 。 由 于 每 幅 图 像 像素 点 之 间 存 在 的 相关 性 ,使 图 片 存在 一 定 的 宛 余 ,去 相关 的 过 程 也 就 
是 消除 元 余 的 过 程 。 预 测 器 可 以 实现 图 像 的 去 相关 ,通过 预测 器 计算 当前 像素 点 的 预测 值 , 然 
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后 将 当前 点 的 实际 值 与 预测 值 相 减 便 可 以 得 到 编码 用 到 的 预测 误差 。 而 预测 器 模型 又 包含 两 
部 分 , 即 用 来 参与 预测 的 相 邻 像素 点 ( 即 训练 集 ) 和 预测 函 ( 可 以 理解 为 参与 预测 的 预测 系 
数 ) ,确定 了 参与 预测 的 相 邻 像素 和 预测 系数 便 可 计算 出 当前 的 预测 值 ,实现 对 当前 点 的 预 
测 。 如 果 预 测 咒 理想 ,预测 得 到 的 预测 值 将 和 当前 像素 点 的 实际 值 相 同 ,但 是 一 般 不 可 能 
实现 。 

(2) 编码 :所 谓 编 码 就 是 预测 误差 的 另 一 种 表达 方式 ,其 可 以 用 更 少 的 比特 进行 表示 。 如 
果 在 编码 之 前 没有 对 预测 误差 进行 量化 ,那么 进行 编码 后 的 数据 通过 解码 可 以 还 原 为 预测 误 
差 ,这 样 整个 预测 编码 实现 的 压缩 为 无 损 压 缩 。 相 反 ,如 果 在 编码 之 前 ,对 预测 误差 进行 量化 ， 
虽然 可 以 减少 比特 数 ,但 是 进行 编码 后 的 预测 误差 即使 进行 了 解码 也 不 能 获得 原始 的 预测 误 
差 , 也 就 无 法 还 原 原 始 图 像 , 这 样 的 预测 编码 实现 的 是 有 损 压缩 。 

在 一 幅 图 像 中 局 部 区 域内 , 相 邻 像素 之 间 灰 度 值 的 差别 可 能 很 小 。 如 果 按 行 扫描 进行 编 
码 时 ,只 记录 第 一 个 像素 的 灰 度 ,而 其 他 像素 的 灰 度 都 用 其 与 前 一 个 像素 灰 度 的 差 来 表示 ,就 
能 达到 压缩 的 目的 。 例 如 ,用 284、2、1\0、1.3 表示 6 个 相 邻 像素 的 灰 度 ,实际 上 这 6 个 像素 的 
灰 度 是 248 、250 251 251 252 255 ;表示 第 二 个 像素 250 需要 bit, 而 表示 差 值 2 只 需要 2bit， 
这 样 就 实现 了 压缩 。 

预测 编码 方法 简单 直接 ,编码 效率 较 高 ,在 图 像 数 据 压缩 和 语音 信号 数据 压缩 中 都 得 到 了 
广泛 应 用 。 经 典 的 编码 方法 有 差分 脉冲 编码 调制 (DPCM) 和 增 量 调制 (AM 或 DM), 

9.3.2 DPCM 编码 


1. DPCM 编码 系统 的 基本 原理 


最 常用 的 预测 编码 方法 是 差分 脉冲 编码 调制 , 即 DPCM。DPCM 系统 的 基本 原理 是 基于 
图 像 中 相 邻 像素 之 间 具 有 较 强 的 相关 性 。 每 个 像素 可 以 根据 前 几 个 已 知 的 像素 值 来 作 预 测 。 
因此 在 预测 编码 中 ,编码 与 传输 的 值 并 不 是 像素 取样 值 本 身 , 而 是 这 个 取样 值 的 预测 值 与 实际 
值 之 间 的 差 值 ,这 样 在 很 大 程度 上 降低 了 图 像 的 空间 元 余 度 ,可 达到 压缩 信息 的 目的 ,计算 证 
明 差 值 的 相关 性 很 小 , 某 种 情况 下 甚至 为 零 。 

DPCM 编码 系统 的 原理 框图 如 图 9-2 所 示 。 











图 9-2 DPCM 编码 系统 的 原理 框图 
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这 一 系统 对 实际 像素 值 与 其 估计 差 值 进行 量化 和 编码 ,然后 输出 。 图 中 xy 为 i、 时 刻 的 
亮度 取样 值 。 预 测 器 根据 先 于 当前 像素 x、 的 样本 值 x ,x,,… ,x、_, 进 行 预测 ,得 到 预测 值 +4、。 
xy Rl x, 之 间 的 误差 为 : 

ey Xy -Êy (9-1) 

量化 器 对 e、 进行 量化 得 到 es ,编码 器 对 a 进行 编码 发 送 。 接 收 端 解码 时 的 预测 过 程 与 发 

送 端 相 同 ,所 用 预测 器 也 相同 。 接 收 端 恢复 的 输出 信号 尺 和 发 送 端 输入 的 信号 x、 的 误差 是 . 
Axy Xy — m X. — (Xy e) =ey—@ (9-2) 

可 见 , 输 入 输出 信号 之 间 的 误差 主要 是 由 量化 器 引起 的 , 即 整个 预测 编码 系统 的 失真 完全 
由 量化 需 产 生 ,不 会 再 产生 其 他 附加 误差 。 当 Ax、 足够 小 时 ,输入 信号 xy 和 DPCM 编码 系统 
的 输出 信号 你 几 乎 一 致 。 假 设 在 发 送 端 去 掉 量 化 器 ,直接 对 预测 误差 进行 编码 、 传 送 ,那么 
ex 2 e, Bl] x. -x =0, 这 就 表明 ;不 带 量化 右 的 DPCM 系统 可 以 完全 不 失真 地 恢复 原始 信号 
x_ ,从 而 实现 信息 保持 编码 。 阁 系统 中 包含 量化 髓 , 且 存 在 量化 误差 时 ,输入 信号 x、 和 恢复 
信号 输出 “之 间 一 定 存在 误差 ,从 而 影响 接收 图 像 的 质量 , 则 为 非 信 息 保 持 编 码 。 因 此 ,在 这 
样 的 系统 中 就 存在 一 个 如 何 能 使 误差 尽 可 能 减 小 的 问题 。 

2. 预测 编码 的 类 型 

H iy 时 刻 之 前 的 样本 值 xm ,x, ,… ,xw1 与 预测 值 之 间 的 关系 呈现 某 种 函数 形式 , 则 该 函数 
一 般 分 为 线性 和 非 线性 两 种 ,预测 编码 器 也 就 有 线性 预测 编码 器 和 非 线性 预测 编码 器 两 种 。 

若 预测 值 zx 与 各 样本 值 x ux, ，…,xN_, 呈 现 线性 关系 : 

XN = È aa, (9-3) 

式 中 ,a,(i=1,2,…,N -1) 为 固定 不 变 的 常数 , 称 为 线性 预测 。a, ,a,,… ,ax_, 为 预测 系 
数 。 用 于 预测 器 的 像素 数 N -1 称 为 预测 阶 数 , 它 对 预测 性 能 有 直接 影响 。 

若 预测 值 *\ 与 各 样本 值 x ,x,,… ,x、_ 不 呈现 如 式 (9-3) 所 示 的 线性 组 合 关系 ,而 是 非 线 
性 关系 , 则 称 为 非 线性 预测 。 

在 图 像 数 据 压 缩 中 ,常用 如 下 几 种 线性 预测 方案 。 

(1) 前 值 预 测 ,当前 像素 的 预测 值 用 与 当前 像素 最 邻近 的 像素 来 表示 , 即 x*、 = ax. s 

(2) 一 维 预测 , 即 采用 x. 同一 扫描 行 中 前 面 已 知 的 若干 个 样本 值 来 预测 c 

(3) 二 维 预测 , 即 不 但 用 $$、 的 同一 扫描 行 以 前 的 几 个 样 值 (xi ,x; ) ,还 要 用 以 前 几 行 的 样 
值 (x, ,x;, x) 来 预测 x\, 是 帧 内 DPCM 预测 中 最 常用 的 一 种 方案 ,如 图 9-3 所 示 。 例 如 . 
Xy 三 QIXI 十 Q2X? t d4X4 十 Q4X4 t dsNXso 


扫描 方向 


有 
BAS. — a a 
当前 像素 


图 9-3 ”二 维 项 测 示意 图 
上 述 都 是 一 幅 图 像 中 像素 点 之 间 的 预测 ,统称 为 帧 内 预测 。 
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(4) 三 维 预测 ( 帧 间 预 测 ) 。 为 了 进一步 压缩 , 常 采用 三 维 预测 , 即 预测 时 不 但 要 用 到 同 
一 行 和 前 几 行 的 像素 值 ,而 且 还 要 利用 上 一 帧 或 前 几 帧 的 临近 像素 值 作 预测 。 由 于 连续 图 
像 (如 电视 ,电影 ) 相 邻 两 帧 之 间 的 时 间 间 隔 很 小 ,通常 相 邻 帧 间 细 节 的 变化 很 少 , 即 相对 应 
像素 的 灰 度 变 化 较 小 ,存在 极 强 的 相关 性 。 帧 间 预 测 编码 利用 连续 图 像 帧 之 间 的 相关 性 ， 
去 除 图 像 帧 的 相同 部 分 , 仅 预 测 编码 差异 部 分 ,可 以 获得 更 大 的 压缩 比 。 例 如 可 视 电 话 , 相 
邻 帧 之 间 通 常 只 有 人 的 口 . 眼 等 少量 区 域 有 变化 而 图 像 中 多 数 区 域 没什么 变化 ,采用 三 维 
预测 可 使 图 像 数 据 压缩 到 电话 话 路 的 频带 之 内 。 帧 间 预 测 在 序列 图 像 的 压缩 编码 中 起 着 
很 重要 的 作用 。 

3. 最 佳 线 性 预测 

采用 均 方 误差 ( MSE ) 为 极 小 值 的 准则 来 获得 的 线性 预测 , 称 为 最 佳 线性 预测 , 亦 即 此 
时 预测 误差 最 小 。 对 于 图 像 来 说 ,最 佳 线性 预测 的 关键 就 是 求 出 各 个 预测 系数 ,使 得 预测 
误差 最 小 ,这 是 一 个 求解 最 佳 线 性 预测 的 问题 。 下 面 给 出 一 个 简单 的 例子 ,讲述 求解 最 佳 
线性 预测 的 过 程 。 

一 幅 图 像 中 空间 相 邻 的 像素 点 ,一般 来 说 ,其 灰 度 值 .颜色 值 都 很 接近 , 即 有 很 强 的 相关 
性 ,因此 可 用 已 知 的 前 面 几 个 扫描 行 邻近 的 像素 对 当前 值 进 行 预测 。 例 如 对 图 9-4 中 f(m,n) 
点 编码 ,利用 与 其 最 近 的 三 个 像素 来 预测 ,可 写 为 : 

J( m,n) 2a, f(m -1,n) *a, f(m -1,n -1) *a, f( m,n -1) (9-4) 


f(m, n1) f(m+1, n-1) 
f(m, n) 


图 9-4 预测 位 置 












= 


fl(m-1, n) 












预测 误差 ; 
e(m,n) 2f(m,n) -f(m,n) (9-5) 


线性 预测 器 中 ,oa a, 和 a, 是 待定 参数 , 当 aa, a, 满足 使 预测 误差 的 方 均值 最 小 且 保 
持 固定 不 变 的 条 件 时 , 便 构 成 最 佳 线性 预测 器 。 
现在 我 们 应 用 均 方 误差 最 小 准则 , 求 出 预测 系数 a, a, a; ,以 获得 f(m n) 的 最 佳 线性 预 


WE P(m,n) 。 
方 均 误差 表达 式 为 


E|[e(m,n) * | El [f(m,n) -fm,n)]’| 
zE|[f(m,n) -a f(m -1,n) - ajf(m-1,n-1) -ajf(m,n -1) ]?| 
(9-6) 


KE El [e(m,n) | 最 小 , 令 
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-9 piLe(m,n)]*] =0 
da, 


aEt[e(m,n) ?| =0 (9-7) 


au El Le(m,n)]*| =0 
解 方 程式 (9-7) , 求 得 w a, .as, 即 为 最 佳 线性 于 硕 测 系数 。 先 求 出 ; 
用 BTe(mm] = Elm,n) -a f(m - 1,2) -afim -1,n -1) 


- a, f(m,n - 1) ]'| 
=-2E|[f(m,n) - a, fí(m - 1,n) - a,f(m - 1,n - 1) 
- a, f(m,n - 1)  * f(m - 1,n)] (9-8) 


FERE, RHE | [e(m, n) T* ME | [e(m, n) 1* | ,将 结果 代入 式 (9-7) 中 ,得 下 列 广 


程 组 : 
E|[f(m,n) -a, f(m -1,n) -a;f(m-1,n-1) -a, f(m,n -1)] *f(m-1,n)] * 
El [f(m,n) -a f(m -1,n) -a, f(m-1,n-1) -a,f(m,n-1)] *f(m-1,n-1)| = 
El [f(m,n) -a f(m-1,n) -a, f(m-1,n-1) -a, f(m,n-1)] *f(m,n-1)| = 
令 相 关系 数 R(m,n;p,g) =E] f(m,n)f(p.q) ,上 式 变 为 : 
R(m,n;m —1,n) = a,R(m - 1,n;m — 1,n) * ajR(m —l1,n — 1;m — 1,n) + 
a,R(m,n —1;m - l,n) 


R(m,n;m -1,n -1) 2 a,R(m —- 1,n;n - 1n - 1) c ajR(Ím - 1n - 151 - 1n - 1) + 


(9-9) 
a,R(m,n —1;m —-l,n -1l) 
R(m,n;m,n -1) = a,R(m —l1,n;m,n — 1) c a,R(m —l,n — 1;m,n —1) + 
a,R(m,n —1;m,n —1) 
对 于 平稳 随机 场 ,相关 函数 只 与 时 间 差 有 关 ,而 与 取样 时 刻 无 关 , 即 满足 : 
R(m,n;p,q) -R(m-p,n-q) -R(a,p) (9-10) 
因此 式 (9-9 ) 可 写 为 : 
R(1,0) za,R(0,0) *a,R(0,1) *a,R(1,1) 
R(1,1) za, R(0,1) +a,R(0,0) +a,R(1,0) (9-11) 
R(0,1) a,R(1,1) * a,RCT,0) +a,R(0,0) 
对 于 f(m,n) 为 平稳 的 一 阶 马 尔 可 夫 过 程 ,有 : 
R(a,B) =R(0,0)exp( =c, |a| - e; |8|) (9-12) 
可 推导 得 : 
R(1,1) = ,R(I1,0)R(O,I) (9-13) 


R(0,0) 
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因此 可 以 解 得 . 
BUS 
^: 7 R(0,0)? 
E o (9-14) 
ROAY 
73 7 R(0,0)? 
可 以 证 明 预 测 误 差 的 方 均值 为 : 
El [e(m,n) |] 2 R(0,0) - [a,R(1,0) +a,R(1,1) +a,R(0,1)] (9-15) 


由 相关 函数 的 性 质 可 知 RCT,0) 、R(1,1) 和 R(0,1) 都 小 于 R(0,0) ,因此 ww a, 和 都 是 
绝对 值 小 于 1 的 值 。 将 式 (9-14) 代 入 式 (9-15) ,可 以 推导 出 : 
E|[e(m,n) ]* | <R(0,0) (9-16) 
由 式 (9-16) 可 知 , 误 差 序列 的 方差 与 信号 序列 相 比 ,总 是 要 小 一 些 ,其 至 可 能 小 很 多 , 即 误 
差 序 列 的 相关 性 比 原始 信号 序列 的 相关 性 要 弱 一 些 , 甚 至 弱 很 多 。 因 此 ,传送 已 经 消去 了 大 部 
分 相关 性 的 误差 序列 有 利于 数据 压缩 。 各 样本 间 相 关 性 越 大 , 差 值 的 方差 就 越 小 ,所 能 达到 的 
压缩 比 也 就 越 大 。 
预测 值 的 选取 还 可 以 扩充 到 更 大 的 邻 域 ,使 用 更 多 的 邻近 像素 进行 预测 , 邻 域 越 大 ,所 选 
的 像素 数 越 多 , 则 预测 器 越 复杂 ,预测 器 设计 得 越 好 ,对 输入 的 数据 压缩 就 越 多 。 由 于 图 像 像 
素 的 相关 性 随 距离 的 增 大 旦 指数 衰减 ,通常 对 于 实际 的 图 像 进 行 预测 时 ,所 选 邻 域 像素 数 一 般 
不 超过 4 个。 
4. 自 适应 预测 编码 
上 述 最 佳 线性 预测 编码 是 在 原 图 像 为 一 平稳 的 随机 过 程 、 其 相关 函数 与 像素 位 置 无 关 的 
前 提 下 得 出 的 结论 ,DPCM 编码 系统 采用 固定 的 预测 系数 和 量化 器 参数 ,然而 实际 图 像 虽 然 在 
总 体 上 一 般 可 以 看 做 是 平稳 的 ,但 在 局 部 范围 内 一 般 是 不 平稳 的 ,所 以 要 求 信号 在 平坦 区 和 边 
缘 处 量化 器 的 输出 差别 很 大 ,否则 会 导致 信号 噪声 。 为 了 尽 可 能 提高 压缩 比 并 且 得 到 较 高 的 
图 像 质量 ,要 求 预测 器 和 量化 器 的 参数 能 够 根据 图 像 的 局 部 区 域 分 布 特点 而 自动 调整 ,这 就 是 
自 适 应 预测 和 自 适 应 量化 。 
(1) 自 适应 预测 
HX (9-4) 可知 一 个 三 阶 预测 器 的 预测 值 计算 公式 为 : 
m,n) =a f(m-1,n)+a,f(m-1,n-1) *a,f( m,n-1) 
现 增 加 一 个 可 变 参 数 “4” ,得 ; 
f(m,n) -k[a,f(m -1,n) *a, f(m-1,n-1) *a,f(m,n -1) ] (9-17) 
式 中 ,k 是 一 个 自 适应 参数 ,k 的 取 值 根据 量化 误差 的 大 小 自 适应 调整 。 
设 量化 器 最 大 输出 为 es,., 最 小 输出 为 eu, 某 一 个 预测 误差 的 量化 输出 为 e'。 
@ 当 e < le'| <e Fl, kA; 
Q le'| ze, tT, k EIK; 
图 当 |e | ze, tT, k 自动 减 小 。 
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随 着 编码 区 间 的 不 同 ,预测 参数 自 适 应 地 变化 ,对 图 像 中 的 黑白 边沿 部 分 ,由 于 |e' | 最大， 
即 在 |e'| =e,, 时 ,k 自动 增 大 ,使 Km,n) 随 之 增 大 ,预测 误差 将 减 小 ,这 样 可 以 减轻 由 斜率 过 
载 而 引起 的 图 像 物体 边沿 模糊 ;相反 ,在 |e'| =e,;, 时 ,k 自动 减 小 ,使 jm,n) 随 之 减 小 ,预测 误 
差 加 大 ,使 量化 器 输出 不 致 正 负 跳 变 ,减轻 图 像 灰 度 平 坦 区 的 颗粒 噪声 。 要 注意 的 是 ,这 里 所 
定义 的 预测 系数 已 不 再 是 一 个 常数 ,而 是 一 个 变量 。 因 此 这 样 的 预测 编码 不 是 线性 预测 编码 ， 
而 是 非 线 性 预测 编码 。 

(2) 自 适应 量化 

在 一 定量 化 级 数 下 减 小 量化 误差 或 在 同样 的 误差 条 件 下 压缩 数据 ,根据 信和 号 分 布 不 均匀 
的 特点 ,系统 具有 自 适应 地 修改 和 调整 量化 器 参数 的 能 力 ,包括 量化 器 输出 的 动态 范围 ,量化 
器 判决 电 平 (量化 步 长 ) 等 ,以 保持 输入 量化 器 的 信号 基本 均匀 ,系统 的 这 种 能 力 叫 自 适应 量 
化 。 实 际 上 是 在 量化 器 分 层 确定 后 , 即 总 的 量化 级 数 确定 后 , 当 预 测 误差 值 小 时 ,将 量化 器 的 
输出 动态 范围 减 小 ,量化 步 长 减 小 ; 当 预 测 误差 大 时 ,将 量化 器 的 输出 范围 扩大 ,量化 步 长 
扩大 。 

9.3.3 AM 编码 


1. AM 编码 的 基本 原理 

增 量 调制 简称 AM 或 增 量 脉 码 调制 方式 (DM) ,AM 编码 是 一 种 简单 的 预测 编码 方法 ， 
1946 年 由 法 国 工 程 师 De Loraine 提出 ,目的 在 于 简化 模拟 信号 的 数字 化 方法 。AM 编码 的 基 
本 原理 框图 如 图 9-5 所 示 ,其 中 图 9-5a) 为 编码 原理 框图 ,图 9-5b) 为 译 码 原理 框图 。AM 编码 
器 包括 比较 器 \ 本 地 译 码 器 和 脉冲 形成 器 三 个 部 分 。 接 收 端 译 码 器 比较 简单 , 它 只 有 一 个 与 译 
码 器 中 的 本 地 译 码 一 样 的 译 码 器 及 一 个 低 通 滤波 器 。 


s(n) x(t) 


a) 编码 器 原理 框图 b) 译 码 器 原理 框图 





图 9-5 AM 编码 . 译 码 的 原理 框图 
AM 编码 需 实 际 上 就 是 1bit 编码 的 预测 编码 器 , 它 用 一 位 码 字 来 表示 e(1) : 
e(t) =x(t) -x(t) (9-18) 


式 中 ,x(1) 为 输入 视频 信号 ;*(1) 是 x(t) 的 预测 值 。AM 编码 器 是 采用 一 位 二 进 制 数码 来 
表示 信号 此 时 刻 的 值 相 对 于 前 一 个 取样 时 刻 的 值 是 增 大 还 是 减 小 , 当 差 值 e(1) 为 一 个 正 值 
时 ,用 “1” 来 表示 ; 当 差 值 e(1) 为 一 个 负 值 时 ,用 “0” 来 表示 。 在 接收 端 , 当 译 码 器 收 到 “1” 时 ， 
信号 则 产生 一 个 正 跳 变 ; 收 到 “0” 时 ,信号 则 产生 一 个 负 跳 变 ,由 此 即 可 实现 译 码 , 当 收 到 连 
“1” 码 时 ,表示 信号 连续 增长 。 当 收 到 连 “0” 码 时 ,表示 信号 连续 下 降 。 

假定 “1” 的 电压 值 为 +E,“0” 的 电压 值 为 -EE,AM 编码 过 程 如 图 9-5 所 示 。 图 像 信号 x(1) 
送 入 相 减 器 ,输出 码 经 本 地 译 码 后 产生 的 预测 值 *+(1) 也 送 入 相 减 器 , 相 减 器 输出 就 是 误差 信 
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号 e(1)。e(t) 送 入 脉冲 形成 器 以 控制 脉冲 的 形成 ,脉冲 形成 器 一 般 由 放大 限 幅 和 双 稳 判决 电 
路 组 成 ,脉冲 形成 器 的 输出 就 是 所 需要 的 码 字 。 码 
率 由 取样 脉冲 决定 , 当 取 样 脉冲 到 达 时 ,e(i) >0 则 
A*1",e(t) «0 则 发 “0"”。 发 “0" 还 是 发 <1" 完 全 y 
由 elt) 的 极 性 来 控制 ,而 与 e) 的 大 小 无 关 。 在 + ?2A 
= 时 ,输入 一 模拟 信号 x(1) ,此 时 x(i6) >El to), 14 
BI e(t) >0, 脉 冲 形成 电路 输出 “1”。 从 开始 本 o 7 
地 译 码 器 将 输出 正 的 斜 变 电 压 ,使 (ti) 上 升 ,以 便 
跟踪 上 x(1)。 由 于 x(1) EKRE, E (D) EFRR, o b ti t h u t k h h b io hi h f 
所 以 在 4 HŽ a(t) -2 Ch) <0, 因 此 第 二 个 时 钟 时 名 
WoFSURG HER i70". DLE ease, TELE LÀ; 
等 时 刻 码 字 的 产生 原理 相同 。 图 9-6 分 别 给 出 了 码 字 
编 出 的 码 流 和 时 钟 信号 的 波形 。 图 9-6 AM 编码 过 程 

2. AM 编码 的 基本 问题 

AM 编码 存在 的 基本 问题 是 斜率 过 载 误差 和 
颗粒 误差 现象 。 

(1) 斜率 过 载 误 差 

由 AM 编码 的 原理 可 知 ,z(1) 应 很 好 地 跟踪 x(t) ,跟踪 得 越 好 ,误差 越 小 。 斜 率 过 载 ,主要 
是 因为 输入 信和 号 的 斜率 较 大 ,调制 器 跟踪 不 上 而 产生 的 。 因 为 在 AM 中 每 个 抽样 间隔 内 只 容 
许 有 一 个 量化 电 平 的 变化 ,所 以 当 输 入 信号 的 斜率 比 抽样 周期 决定 的 固定 斜率 大 时 ,x*(t) 很 难 
跟踪 上 x(1) 的 变化 ,这 时 就 会 产生 较 大 的 误差 ,因而 产生 斜率 过 载 失真 。 和 斜率 过 载 现 象 将 使 
图 像 中 原本 陡峭 的 轮廓 变 为 缓 变 的 轮廓 ,从 而 引起 图 像 边缘 的 模糊 ,并 且 整 个 图 像 产生 纹 状 
表面 。 

产生 这 种 现象 的 原因 是 由 于 量化 台阶 的 大 小 是 固定 不 变 的 , 自 适应 增 量 编码 法 的 基本 思 
想 则 是 根据 信和 号 变化 快慢 相应 的 调整 量化 台阶 大 小 ,这 种 改变 可 由 系统 自动 控制 ,由 于 出 现 斜 
率 过 载 现象 时 ,编码 输出 将 是 连续 "17 或 连续 “0” 码 ,因此 通过 监测 编码 输出 中 连续 “17 或 连 
续 “0” 的 个 数 ,可 检测 出 输入 信号 的 变化 趋势 ,及 时 调整 量化 台阶 ,以 便 较 好 地 跟踪 输入 信号 ， 
所 以 自 适 应 增 量 编码 法 可 以 较 好 地 解决 这 个 问题 。 

(2) 颗粒 误差 

在 输入 信和 号 缓慢 变化 的 部 分 , 即 输入 信和 号 与 预测 信号 的 差 值 接近 零 的 区 域 ,输出 会 出 现 随 
机 交 变 的 “0"” 和 “1”, 颗 粒 误差 是 信号 平坦 区 反复 量化 产生 的 ,如 图 9-7 所 示 。 这 种 跳 变 在 图 
像 中 表现 为 胡椒 状 颗粒 噪声 。 

为 了 尽 可 能 减 小 颗粒 误差 ,就 要 减 小 量化 台阶 ,但 减 小 量化 台阶 就 不 能 精确 地 跟 上 快速 上 
升 信号 的 变化 ,这 样 做 又 会 加 大 斜率 过 载 ; 相 反 , 如 果 要 尽量 避免 斜率 过 载 ,就 要 增 大 量化 台 
阶 , 因 此 两 者 应 折 中 考虑 。 现 在 最 好 的 解决 办 法 就 是 利用 自 适 应 技术 ,不 再 采用 固定 的 量化 台 
阶 ,而 是 根据 输入 信和 号 情况 的 不 同 , 自 适应 地 调整 量化 台阶 ,这 种 系统 就 是 自 适 应 增 量 编码 系 
统 (ADM) 。 这 种 系统 有 效 地 解决 了 斜率 过 载 现象 , 减 小 了 颗粒 误差 。 
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斜率 过 载 


图 9-7 斜率 过 载 和 颗粒 误差 
预测 编码 实现 技术 简单 ,但 压缩 能 力 不 高 而 且 抗 干扰 能 力 较 差 ,对 传输 中 误差 有 积累 现 
象 ,因此 一 般 不 单独 使 用 ,而 是 与 其 他 方法 结合 使 用 。 例 如 在 PEG 标准 中 ,采用 的 直流 (DC) 
预测 算法 ,就 是 对 离散 余弦 变换 后 的 直流 系数 进行 帧 内 预测 编码 。 


9.4 统计 编码 


统计 编码 是 指 建立 在 图 像 统 计 特 征 基 础 之 上 的 一 类 压缩 编码 方式 ,根据 信 源 的 频率 分 布 
特性 ,分 配 不 同 长 度 的 码 字 ,降低 平均 码 字 长 度 ,以 提高 传输 速度 ,节省 存储 空间 。 


9.4.1 游程 长 度 编码 


游程 长 度 编码 (Run Length Encoding) 又 叫 行程 编码 ,是 一 种 基于 统计 的 变 长 编码 方式 ,是 
相对 比较 简单 的 无 损 压 缩编 码 ,在 早期 被 广泛 使 用 。 其 原理 很 简单 ,就 是 将 一 行 中 灰 度 值 相同 
的 相 邻 像素 用 一 个 计数 值 和 灰 度 值 来 代替 ,进而 减少 符号 个 数 达到 压缩 的 效果 。 例 如 : 


aaaa bbb cc d eeeee fffffff 


假设 每 个 像素 用 8bit 编码 , 共 需 22 x 8bit = 176bit。 若 表示 4a3b2cldSe7f, 只 
需 12 x8bit = 96bit。 

把 具有 相同 灰 度 值 相 邻 像素 组 成 的 序列 称 为 一 个 游程 ,游程 中 像素 的 个 数 称 为 游程 长 度 ， 
简称 游 长 。 游 程 编 码 的 思想 主要 源 于 栅 格 图 像 中 的 扫描 ,在 栅 格 图 像 中 相同 的 行 或 列 中 常常 
会 存在 若干 具有 相同 属性 值 的 像素 点 ,对 于 这 些 大 量 的 重复 信息 ,游程 编码 规定 只 有 在 行 或 列 
中 数据 代码 发 生变 化 时 , 才 记录 下 其 数据 的 具体 值 和 数据 连续 的 个 数 ,这 样 就 起 到 了 一 个 消去 
宛 余 信息 的 作用 ,从 而 实现 数据 压缩 。 

对 于 黑白 二 值 图 像 , 由 于 图 像 的 相关 性 ,在 每 一 扫描 行 上 ,总 是 可 以 分 割 成 若干 个 白 像素 
( 白 长 ) 和 黑 像 素 段 ( 黑 长 ) 之 和 ,如 图 9-8 所 示 。 


C E [171777] HN [ [1] l LLL] 


图 9-8 白 长 和 黑 长 
因为 白 长 和 黑 长 是 交替 出 现 的 ,所 以 在 编码 时 ,只 需 对 每 一 行 的 第 一 个 像素 做 一 个 标志 ， 
以 区 分 该 行 是 以 白 长 还 是 以 黑 长 开始 ,后 面 就 只 写 游 长 即 可 。 实 际 上 ,行程 编码 是 分 两 步 进行 
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的 ,首先 对 每 一 行 交 替 出 现 的 白 长 和 黑 长 进行 统计 ,图 9-8 可 写成 :4 个 白 ,5 个 黑 ,7 个 白 ,5 个 
黑 ,7 个 白 ,5 个 黑 ,9 个 白 ,3 个 黑 ,3 个 白 。 然 后 ,再 对 游 长 进行 变 长 编码 , 即 根据 其 不 同 的 出 
现 概率 分 配 以 不 同 长 度 的 码 字 。 在 进行 变 长 变 码 时 ,经 常 采用 霍 夫 曼 编 码 , 关 于 霍 夫 曼 ,后 面 
讲述 。 

一 般 来 说 ,如 果 游 程 编码 中 游程 的 长 度 越 长 ,那么 编码 效率 会 越 高。 对 于 灰 度 图 像 或 彩色 
图 像 ,也 可 以 采用 游程 编码 。 如 果 一 幅 图 像 由 很 多 块 灰 度 相同 的 大 面积 区 域 组 成 ,那么 采用 行 
程 编码 的 压缩 效率 是 惊人 的 ,但 是 ,如 果 图 像 中 每 两 个 相 邻 点 的 灰 度 都 不 同 ,用 这 种 算法 不 但 
不 能 压缩 ,反而 数据 量 会 增加 一 倍 , 所 以 现在 单纯 采用 行程 编码 的 压缩 算法 并 不 多 。 

9.4.2 起 夫 曼 编 码 


霍 夫 曼 编 码 由 霍 夫 曼 于 1952 年 提出 ,是 一 种 无 失真 压缩 技术 ,也 是 一 种 变 长 编码 方式 , 根 
据 香 农 定理 和 范 若 编码 思想 为 压缩 文本 文件 提出 的 方法 。 它 的 基本 原理 是 按照 所 对 应 信号 出 
现 概率 大 小 顺序 排列 信 源 信号 ,并 设法 按 逆 顺 序 分 配 码 字 字 长 ,使 编码 的 码 字 是 可 辨识 的 。 埠 
夫 曼 编码 相对 于 游程 编码 要 更 为 复杂 一 些 , 且 具有 更 强 的 统计 特性 。 

假设 一 个 文件 中 出 现 了 8 种 消息 S0.,51 ,52.,53 .34.S5、S6 S7 ,那么 每 种 消息 要 编码 ,至 少 需要 3 比 
特 。 假 设 编 码 成 O00, 001, 010, 011, 100, 101, 110, 111 ( 称 做 码 字 ), 那 么 符号 序列 
SOS1S7S0S1S6S2S2S3S4S5SOSOS1 编码 完成 后 就 变 成 了 000001111000001110010010011100101000000001 , 公 
用 了 42 比特 。 但 是 S0、.S1、S2 这 三 个 消息 出 现 的 频率 比较 大 ,其 他 消息 出 现 的 频率 比较 小 ,如 
果 采 用 一 种 编码 方案 使 得 S0、S1 、52 的 码 字 短 , 其 他 消息 码 字 长 ,这 样 就 能 够 减少 占用 的 比 
特 数 。 

将 上 述 的 编码 方案 进行 改进 :80 到 S7 的 码 字 分 别 为 01,11,101 ,0000,0001 ,0010,0011 , 
100 ,那么 上 述 消息 序列 变 成 011110001110011101101000000010010010111, 共 用 39 比特 ,尽管 
有 些 字 码 如 83 、S4、S5 、56 变 长 了 (由 3 位 变 成 4 位 ) ,但 使 用 频繁 的 几 个 码 字 如 50、51 变 短 了 ， 
所 以 实现 了 压缩 。 

可 以 用 下 面 的 步骤 得 到 霍 夫 曼 编 码 的 码 表 。 

(1) 把 信 源 XX 中 的 消息 按照 出 现 的 概率 从 大 到 小 的 顺序 进行 排列 , 即 

P mPORP mec, (9-19) 

(2) 把 最 后 两 个 出 现 概 率 最 小 的 消息 合并 成 一 个 消息 ,从 而 使 信 源 的 消息 数 减少 一 个 ,并 

同时 再 次 将 信 源 中 消息 的 概率 从 大 到 小 排列 一 次 。 


Hj Hj dj cU Uk 
x a | (9-20) 
Pp BB me Pia 
(3) 重 复 上 述 步骤 ,直到 信 源 最 后 合并 为 X? 的 形式 为 止 。X 的 形式 如 下 : 
u? u? 
3 9-21 
E. i S 


(4) 将 合并 的 消息 分 别 赋 以 1 和 0 或 者 0 和 1。 最 后 的 六 也 对 相应 的 w 和 四 赋 以 1 和 0 
或 者 0 和 1。 
图 9-9 所 示 以 包含 SO-S7 的 信 源 为 例 , 说 明 得 到 霍 夫 曼 编码 表 的 过 程 。 
其 中 信 源 的 各 个 消息 从 S0-S7 出 现 的 概率 分 别 为 0. 30,0. 21,0. 14,0. 07,0. 07, 
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0. 07.0.07 .0.07。 下 面 计 算 图 9-9 中 的 编码 效率 。 





$3 S4 SS S6 S7 S2 S S0 
0000 0001 0010 0011 100 101 11 01 
图 9-9 霍 夫 曼 编码 示意 图 
H = - $P(b)logP(b,) 
= -5 x0. 07log, 0.07 —0. 14log, 0. 14 -0.21log, 0. 21 -0. 30log, 0. 30 


2.73 (9-22) 
7 
Laig = ÈL, P; 
=0. 07 x4 x4 +0. 07 x3 +0. 14 x3 +0.21 x2 +0. 30 x2 
ru (9-23) 
编码 效率 为 ; 
-H(u) -2. 73 = - 

"77; x 100% 7273 x 10096 -98. 5% (9-24) 


avg 


编码 的 元 余 只 有 1. 596 ,可 见 霍 夫 曼 编码 的 效率 很 高 。 然 而 霍 夫 曼 编码 仍 是 基于 统计 的 
变 长 编码 , 故 需要 较 大 的 缓冲 和 优质 的 信道 。 

产生 霍 夫 曼 编码 需要 对 原始 数据 扫描 两 遍 : 第 一 遍 扫描 要 精确 地 统计 出 原始 数据 ,每 个 值 
出 现 的 频率 ;第 二 遍 是 建立 霍 夫 曼 树 进 行 编码 。 由 于 需要 建立 二 又 树 并 遍历 二 又 树 生 成 编码 ， 
因此 数据 压缩 和 还 原 速度 都 较 慢 ,但 简单 有 效 , 因 而 得 到 广泛 应 用 。 

9.4.3 算术 编码 


压缩 编码 的 目的 是 用 尽 可 能 短 的 码 字 来 表示 单个 或 连续 多 个 事件 发 生 时 所 包含 的 所 有 信 

息 ,设计 理念 就 是 用 尽 可 能 短 的 码 字 来 表示 大 概率 事件 ,而 对 于 小 概率 事件 则 用 较 长 的 码 字 表 

示 。 而 算术 编码 的 平均 码 长 在 理论 上 接近 理想 灶 值 ,被 广泛 推崇 ,在 多 种 编码 标准 中 都 令 其 作 

为 炉 编 码 方 式 。 和 和 霍 夫 曼 编 码 相 比 ,算术 编码 对 源 字母 进行 编码 不 如 霍 夫 曼 编码 好 ,但 对 源 字 

母 序 排列 编码 ,算术 编码 比 霍 夫 曼 编码 好 ,不 需要 在 N 改变 时 重新 计算 和 分 配 比特 数 。 可 以 
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用 分 数 比 特 编码 ,获得 较 高 的 压缩 率 。 算 术 编 码 算法 同 符号 概率 统计 是 相互 独立 的 ,不 像 霍 夫 
曼 编码 那样 ,符号 概率 统计 的 改变 需要 重新 建立 霍 夫 曼 树 ,并 改变 码 表 , 算 术 编码 更 易于 实现 
自 适应 。 

1. 编码 过 程 

算术 编码 的 方法 是 将 被 编码 的 消息 或 者 符号 串 表示 成 0 和 1 之 间 的 一 个 间隔 ,即将 其 纺 
码 成 [0,1) 之 间 的 浮 点 小 数 。 符 号 序列 越 长 ,编码 的 间隔 也 就 越 小 ,表示 这 一 间隔 所 需 的 位 数 
也 就 越 多 。 由 于 信 源 的 符号 序列 需要 根据 某 种 编码 模式 生成 概率 的 大 小 来 减少 间隔 ,出 现 概 
率 大 的 符号 下 要 比 出 现 概率 小 的 符号 减少 范围 小 ,因此 ,只 要 增加 减少 的 比特 位 就 可 以 对 新 
增加 的 信息 进行 编码 。 

在 编码 任何 消息 之 前 ,符号 串 的 完整 范围 被 设 定 为 [0,1] 。 当 一 个 符号 被 处 理 时 ,这 一 范 
围 就 根据 分 配给 这 一 符号 的 范围 变 窗 。 算 术 编 码 过 程 实际 上 就 是 根据 信和 号 源 发 生 概率 对 区 间 
[0 ,1 ) 进行 分 割 的 过 程 。 

现 以 二 值 信 源 的 算术 编码 为 例 来 说 明 编 码 过 程 , 多 值 信 源 的 编码 方法 可 以 类 推 。 

设 信 源 有 两 种 符号 0 和 1, 它 们 出 现 的 概率 分 别 是 1/4 和 3/4。 区 间 [0,1] 被 分 割 成 两 个 
概率 范围 [0,1/4] [1/4,1]。 其 中 ,0 是 符号 0 的 rangelow,1/4 是 符号 0 的 rangehigh ,同时 1/4 
还 是 符号 1 的 rangelow,1 是 符号 1 的 rangehigh。 这 时 区 间 的 范围 (range) 为 1 ,范围 的 下 限 
(low) 为 0, 上 限 (high) 为 1。 

对 于 消息 S 的 符号 序列 {ai} 的 算术 编码 过 程 可 以 概括 成 以 下 几 步 。 

(1) 初 始 化 时 ,low =0,high =1 ,被 分 割 的 范围 range = high-low =1。 

(2) 下 一 个 范围 high 和 low 可 以 根据 输入 的 不 同 符号 a, (a, 的 取 值 是 1 或 者 0) ,由 式 (9- 
25 ) i. 

pis = low + range x S EA (9-25) 
high = low + range x rangehigh 

其 中 ,等 号 右 侧 的 low 为 上 一 个 被 编码 字符 a, 所 在 区 间 的 下 限 ,high WER, rangehigh 
为 当前 编码 字符 a, 概率 范围 的 下 限 ,rangelow 为 下 限 。 通 过 上 式 的 计算 , 左 侧 的 low 得 到 当前 
编码 字符 区 间 的 下 限 ,high 为 上 限 。 

(3) 重 复 过 程 (2) 直到 所 有 的 符号 都 被 编码 为 止 。 

编码 结果 就 是 消息 落 在 的 区 间 范 围 。 从 上 面 的 编码 过 程 可 知 , 对 于 不 同 的 消息 ,编码 过 程 
是 唯一 的 。 所 以 选取 区 间 中 任何 一 点 ,都 可 以 表示 这 个 区 间 , 也 就 是 被 编码 的 消息 S, ELI 
有 冲突 。 

下 面 来 讨论 如 何 选取 这 个 点 , 令 : 

|o P (9-26) 

其 中 ,L 代表 码 字 长 度 p(s) 在 编码 消息 出 现 的 概率 ,可 以 由 每 个 字符 的 概率 p (a, ) 相 乘 
得 到 . 

p(s) 2p(a,) xp(a,) x: xp(a, 4) xp(a,) (9-27) 

最 后 把 得 到 的 编码 结果 的 区 间 下 限 rangelow 写成 二 进 制 的 小 数 , 取 其 前 二 位 ,如 果 后 面 尚 
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有 位 数 ,就 进位 到 第 二 位 ,这 样 得 到 一 个 数 C, 用 C 就 可 以 为 消息 S 的 算术 编码 码 字 。 

如 果 消 息 为 0010 ,具体 的 计算 如 下 : 

从 [0,1] 开 始 ,一 个 符号 一 个 符号 地 迭代 分 解 区 间 。 

第 1 个 字符 0, 取 [0,1] 区 间 的 前 1/4, 即 区 间 [0,1/4]。 

第 2 个 字符 0, 取 [0,1/4] 区 间 的 前 1/4, 即 区 间 [0,1/16]。 

第 3 个 字符 1, 取 [0,1/16] 区 间 的 前 3/4, 即 区 间 [ 1/64,1/64]。 

第 4 个 字符 0, 取 [1/64,1/64] 区 间 的 前 1/4, BH EX TH] [ 4/256, 7/256 ] ,其 二 进 制 表示 为 
[0. 000000100 ,0. 00000111], 

消息 0010 的 出 现 概率 p(;) 为 : 

p(s) 20.25? x0. 75 20. 01171875 (9-28) 
人 码 字 的 长 度 为 : 


Ls [iog zs e (9-29) 


由 于 rangelow =0. 00000100 , 码 字 长 度 为 7, 且 没有 余数 ,因此 C 为 0. 0000010。 最 后 输出 
的 二 进 制 码 字 为 0000010。 
上 述 编码 过 程 若 用 数 轴 上 的 点 来 表示 ,将 更 加 清楚 ,如 图 9-10 所 示 。 





0 0 
0.01 1 
t 
0 
0 
0.001 0.01 
id 
1 0 
0.000001 0.001 
0.00000100 0.00000101 0.00010000 


图 9-10 算术 编码 过 程 

综 上 所 述 ,算术 编码 从 全 局 出 发 ,是 采用 递 推 形式 的 一 种 连续 编码 。 不 同 的 输入 符号 一 定 
落 入 不 同 的 区 间 , 不 会 互相 重叠, 因此 编码 结果 是 唯一 的 。 不 同 信息 组 合 映射 到 不 同 的 实数 区 
间 , 信 息 中 所 用 符号 出 现 的 概率 愈 大 ,对 应 的 区 间 也 傅 大 ,就 愈 有 机 会 选择 较 短 的 码 字 来 表示 
该 信息 。 当 编码 的 符号 数目 足够 多 时 ,编码 效率 趋向 于 这 些 信息 的 箭 值 。 

算术 编码 本 身 虽然 有 很 多 优点 ,但 并 不 是 在 所 有 情况 下 都 是 最 优选 择 。 例 如 在 概率 等 分 
布 的 编码 中 等 长 编码 依旧 是 最 好 的 选择 ,又 如 对 于 较 大 的 符号 表 在 给 定 概率 的 情况 下 ERE 
编码 要 优 于 算术 编码 。 

2. 解码 过 程 

解码 是 编码 的 逆 过 程 ,理解 了 编码 过 程 ,解码 过 程 的 操作 就 容易 多 了 。 由 于 编码 的 结果 
0. 0000010 是 消息 0010 的 唯一 编码 ,因此 在 解码 的 时 候 只 需要 判断 当前 的 解码 值 落 在 哪 一 个 
符号 的 概率 范围 ,就 能 正确 解 出 符号 ,进行 输出 。 
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例如 二 进 制 0. 0000010 落 在 区 间 [0,1/4) 之 中 ,所 以 第 1 个 符号 就 是 0。 解 出 第 1 个 符号 
以 后 ,由 0 的 rangehigh 和 rangelow ,以 及 当前 区 间 的 范围 (range)1 ,首先 减 去 符号 0 的 rangelow 
(0.0) ,得 到 二 进 制 0. 0000010 ,然后 用 0. 0000010 除 以 符号 0 的 概率 1/4 得 到 二 进 制 0. 0001。 
0. 001 落 在 [0,1/4) 之 中 ,所 以 第 2 个 符号 也 为 0。 按 照 上 述 的 方法 ,就 可 以 得 到 编码 时 全 部 
符号 。 

解码 过 程 可 以 综合 如 下 : 


. 0. 0000010 
i a 


=0. 0000010 
o; 9. 0000010 -0 
f 0. 01 
,,0.0001 -0 
` 0.01 

.0.01 -0.01 _ 
7 E 


- 0. 0001 
(9-30) 





z0.01 


0 0 


解码 公式 可 以 概括 为 : 
number 一 rangelow _ de: (9-31) 


range 
9.5 ”位 平面 编码 


位 平面 编码 将 多 灰 度 值 图 像 分 解 成 一 系列 二 值 图 ,然后 对 每 一 幅 二 值 图 再 用 二 元 压缩 方 
法 进行 压缩 。 其 基本 思想 是 经 过 小 波 变 换 和 量化 后 ,图像 矩阵 变 成 一 个 系数 均 为 整数 的 子 带 
和 抢 阵 。 每 个 子 带 又 要 划分 为 固定 大 小 的 独立 代码 块 , 即 为 位 平面 编码 的 最 小 单元 。 这 种 算法 
除 既 能 减少 编码 元 余 ,又 能 降低 图 像 中 像素 之 间 的 空域 元 余 。 位 平面 编码 主要 分 为 两 个 步 又; 
位 平面 分 解 和 位 平面 编码 。 


9.5.1 位 平面 分 解 


位 平面 分 解 是 指 将 一 幅 具 有 m bit 灰 度 级 的 图 像 分 解 成 m 幅 1bit 的 二 值 图 像 。 可 以 采用 
如 下 多 项 式 : 
Oe *a, 42"? e --- Fa aa (9-32) 
来 表示 具有 m bit 灰 度 级 的 图 像 中 像素 的 灰 度 值 。 根 据 上 述 多 项 式 把 一 幅 灰 度 图 分 解 成 一 系 
列 二 值 图 集合 的 一 种 简单 方法 就 是 把 上 述 多 项 式 的 m 个 系数 分 别 分 到 m 个 1bit 的 位 平面 中 ， 
将 每 个 像素 的 第 一 个 比特 集合 在 一 起 就 得 到 图 像 的 第 一 个 位 平面 。 但 是 这 种 分 解码 法 有 一 个 
固有 缺点 , 即 像素 点 灰 度 值 的 微小 变化 有 可 能 对 位 平面 的 复杂 度 产生 明显 的 影响 。 比 如 , 当空 
间 相 邻 的 两 个 像素 点 分 别 是 127(0111 1111) 和 128(1000 0000) 时 ,图 像 的 每 个 位 平面 上 在 这 
个 位 置 处 都 将 有 从 0 一 1 (或 1 一 0) 的 过 渡 。 
为 减少 这 种 灰 度 值 微小 变化 的 影响 ,可 用 1 个 m bit 灰 度 码 来 表示 图 像 。 灰 度 码 可 由 下 式 
计算 : 
aiCoai ,， 0xizm -2 
E (9-33) 


d; izm-1 
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用 灰 度 码 表达 的 位 平面 复杂 度 较 低 , 但 具有 视觉 意义 信息 的 位 面 图 数量 更 多 ,其 中 @ 代 表 
异 或 操作 。 这 种 码 的 独特 性 质 是 相 邻 的 码 字 只 有 1 个 比特 位 的 区 别 , 从 而 像素 点 的 微小 变化 
就 不 容易 影响 到 所 有 位 平面 。 比 如 ,还 是 以 127 和 128 为 例 ,如 果 用 式 (9-2) 计 算 的 话 ,这 里 只 
有 一 个 平面 有 从 0 一 1 的 过 渡 , 因 为 此 时 的 127 和 128 的 灰 度 码 已 经 计算 为 0100 0000 和 
1100 0000, 


9.5.2 ”位 平面 编码 方法 


位 平面 分 解 之 后 ,每 个 位 平面 都 是 二 值 图 像 ,编码 方法 有 1-D 游程 编码 .2-D 游程 编码 、 常 
数 块 编码 和 边界 跟踪 编码 等 。 常 数 块 编码 和 边界 跟踪 编码 都 是 对 位 平面 中 大 片 相同 值 (全 为 
1 或 者 全 为 0) 的 区 域 ( 称 之 为 常数 区 域 ) 进行 编码 。 

压缩 位 平面 图 的 一 种 简单 而 有 效 的 方法 是 用 专门 的 码 字 表 达 全 是 1 或 0 的 区 域 。 它 将 图 
像 分 成 全 黑 、 全 白 或 者 混合 的 m xn 尺寸 的 块 。 出 现 频 率 最 高 的 赋予 1bit BF 0, 其 他 两 类 分 
别 赋予 2bit 的 11 和 10 码 字 。 这 样 ,原来 某 个 位 平面 需要 m x nbit 表示 的 常数 块 现在 只 用 1bit 
或 者 2bit 的 码 字 表示 ,从 而 达到 了 压缩 的 目的 。 

1-D 游程 编码 的 基本 思路 是 对 一 组 从 左 向 右 扫描 得 到 的 连续 0 或 1 游程 用 他 们 的 长 度 来 
编码 。 这 里 需要 确定 游程 值 的 协定 ,常用 的 方法 是 :指出 每 行 第 一 个 游程 的 值 或 者 设 定 每 行 都 
由 白色 游程 开始 。 

2-D 游程 编码 的 一 种 常用 的 方法 称 为 相对 地 址 编码 , 它 的 基本 原理 是 跟踪 各 个 黑色 和 白 
色 游 程 的 起 始 和 终结 过 渡 点 。 

通过 跟踪 二 值 图 中 的 区 域 边 界 进 行 编码 也 可 以 达到 对 常数 区 域 编 码 的 目的 。 预 测 差异 量 
化 就 是 一 种 面向 扫描 线 的 边界 跟踪 方法 ,详细 介绍 可 参考 有 关 文 献 。 


9.6 静止 图 像 压缩 编码 实例 


现代 计算 机 建立 在 数字 化 的 基础 上 ,用 离散 的 数字 表示 模拟 量 时 ,如 果 要 很 高 的 精确 度 ， 
会 产生 非常 庞大 的 数据 量 。 男 外 ,由 于 互联 网 的 发 展 ,信息 “爆炸 ”的 时 代 已 经 到 来 。 互 联网 
一 天 产生 的 信息 量 需 要 1. 68 亿 张 DVD 进行 存储 。 图 像 数 据 远 比 文本 更 占 空 间 ,1MB 空间 可 
以 存放 一 部 百 万 字 的 小 说 , 却 只 能 存放 大 约 20 张 256 x 256 大 小 的 灰 度 BMP 图 片 。 与 存储 空 
间 相 比 ,信息 传输 上 对 数据 压缩 提出 了 更 高 的 要 求 。 一 路 标准 清晰 度 彩 色 电 视 对 亮度 分 量 Y 
和 人 色 度 分 量 R-Y、B-Y 的 取样 频率 分 别 为 13. 5MHz、6.75MHz、6.75MHz, 每 个 数 采用 8bit 量化 ， 
因此 码 率 为 ; 
(13.5 +6.75 +6.75) x8 2216(Mbit/s) (9-34) 
这 么 大 的 数据 量 ,是 不 可 能 不 经 过 压缩 直接 传输 的 。 因 此 ,对 图 像 进行 压缩 ,就 成 了 当 务 
之 急 。 本 节 以 静止 图 像 压 缩编 码 国际 标准 JPEG 为 例 ,讲述 压缩 编码 技术 在 静止 图 像 压缩 中 
是 如 何 应 用 的 。 
JPEG 是 联合 图 像 专家 组 (Joint Photographic Expeerts Group ) 的 简称 , 它 是 一 个 由 国际 标准 
化 组 织 和 国际 电报 电话 咨询 委员 会 所 建立 的 ,从 事 静 态 图 像 压 缩 标准 制定 的 委员 会 。 它 于 20 
世纪 80 年 代 末 90 年 代 初 制定 出 了 第 一 套 国标 静态 图 像 压 缩 标 准 ISO 10918. 1 ,也 就 是 我 们 所 
WHY JPEG, H F JPEG 算法 复杂 度 低 , 压 缩 性 能 较 好 ,使 得 它 在 短 短 的 几 年 内 就 获得 极 大 的 
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成 功 , 目 前 网 站 上 80% 的 图 像 都 是 采用 JPEG 的 压缩 标准 。 

JPEG 静止 图 像 压 缩 标准 虽然 在 中 高 速率 上 压缩 效果 较 好 ,但 在 低 比 特 速率 的 情况 下 , 重 
构图 像 存 在 严重 的 方块 效应 ,不 能 很 好 的 适应 网 络 传输 图 像 的 需要 。 

9.6.1 JPEG 基本 系统 

JPEG 标准 主要 采用 了 基于 块 的 DCT 变换 编码 ,同时 综合 应 用 了 以 上 讲述 的 游程 编码 、 零 
夫 曼 编码 等 方法 。JPEG 基本 系统 是 一 种 顺序 DCT 算法 ,这 类 算法 在 量化 过 程 中 引入 误差 , 压 
缩 后 图 像 是 失真 的 。 利 用 人 的 视觉 系统 的 生理 特性 ,使 用 量化 和 无 损 压 缩编 码 去 掉 视觉 的 元 
余 信息 和 数据 本 身 的 宛 余 信息 。JPESG 编码 的 处 理 过 程 ,对 于 一 幅 图 像 首先 将 其 分 成 许多 个 
8 x8 的 小 块 ,也 就 是 每 个 小 块 有 8 x8 264 个 像素 ;分 成 多 少 个 小 块 要 看 图 像 的 分 辨 率 , 分辨 率 
高 ,分 的 块 就 越 多 ,分 辩 率 小 ,分 的 块 就 越 少 。 然 后 对 每 一 个 8 x8 的 块 进行 二 维 DCT 变换 ,经 
过 DCT 变换 后 就 得 到 频 域 的 64 个 离散 余弦 变换 系数 ,然后 要 对 这 64 个 系数 进行 量化 ,DCT 
系数 量化 中 所 必需 的 量化 表 及 人 炉 编 码 中 所 必需 的 表 的 具体 值 ,根据 进行 编码 的 图 像 不 同 而 不 
同 , 一 般 取 JPEG 标准 推荐 的 量化 表 , 量 化 是 根据 量化 表 进 行 的 ,量化 表 是 JPEG 组 织 根据 人 的 
眼睛 视觉 的 特性 规定 好 的 ,直接 用 量化 表 去 除 得 到 的 64 个 系数 就 是 量化 ,量化 后 得 到 的 仍 是 
一 个 64(8 x8) 个 系数 ,而 这 一 系数 己 是 低频 集中 在 左上 角 的 一 个 (8 x8) 系数 。 最 后 再 利用 
Jii £j f ROSE EGET T A AER 8 48 023 Jr 15-80] Ce C HA RRR JPEG 有 损 压缩 算法 编码 
的 大 致 流程 如 图 9-11 所 示 。 


























[| 量化 表 | ”| mx | 存储 或 传输 




















图 9-11 JPEG 基本 系统 框图 


第 一 步 , 对 图 像 块 (把 整个 图 像 分 成 多 个 8 x8 子 块 ) 进 行 DCT 变换 ,得 到 DCT 系数 ;第 二 
步 ,根据 量化 表 对 DCT 系数 进行 量化 ;第 三 步 ,对 DCT 系数 中 的 直流 ( DC) 系数 进 行 差分 预测 ， 
对 交流 (AC) 系数 按 Zig-Zag 顺序 重新 排列 ;第 四 步 ,对 第 三 步 得 到 的 系数 进行 霍 夫 曼 ( Huff- 
man ) 编码 。 

1. FDCT £e IDCT 

JPEG 基本 系统 以 DCT 变换 为 基础 ,采用 固定 的 8 x 8 方块 ,所 以 标准 中 采用 8 x 8 点 的 二 
HE DCT 变换 。 正 向 DCT(FDCT) 和 反 向 DCT(IDCT) 的 表达 式 分 别 为 : 


I 
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Flu) sL C(u) Clo) È X fies HT s [ien] (9-35) 
和 
fp AX F(u,») Cu) CCo) cos [GE m s [82] (9-36) 
Hum. 
1/42 u,v-0 
Uu) ita ss , 9.37 
(u) ,C(v) | i 其 他 ( ) 


f(0,0) f(0,1) -- j/(0,7) 


eun A1,0) fn) es fan ks 
(7,0) fT,1) = A7,7) 
F(0,0) JF(0,1)- —« FOT 

pcr P TuS PR (9-39) 
F(7,0) F01) es FJ) 


在 JPEG 基本 系统 中 ,f(x,y) 为 8bit 像素 , 即 取 值 范围 为 0 - 255 ,由 DCT 变换 可 求 得 DC 系 
数 (0,0) 的 取 值 范围 为 0 ~ 2040 ,实际 上 ,同样 可 以 求 出 (0,0) 是 图 像 均值 的 8 倍 , 除 F(0,0) 
的 取 值 范围 为 AC 系数 。 关 于 二 维 DCT 的 具体 实现 ,已 有 一 些 快速 算法 。 

为 什么 图 像 处 理 中 不 用 DFT 而 用 DCT 呢 ? 原因 一 是 实时 图 像 处 理 时 ,每 秒 钟 要 处 理 数 
百 万 力 至 数 千 万 的 数据 ,而 DFT 要 求 复数 运算 ,所 以 运算 量 大 ,难以 满足 实时 图 像 处 理 的 要 
求 。 但 是 DCT 是 一 种 实数 域 的 变换 ,运算 量 比 DFT 少 。 原 因 之 二 是 DCT 的 变换 矩阵 的 基 向 
量 很 接近 托 波 列 兹 ( Toeplitz) 和 矩阵 的 特征 向 量 , 而 语音 信号 和 图 像 信 号 的 协 方差 矩阵 都 是 托 波 
列 兹 矩阵 ,就 这 是 为 什么 DCT 变换 接近 最 佳 变换 , 即 KLH( Karhunen loeve Hoteling) 变换 ,这 种 
变换 产生 非 相关 变换 系数 ( 即 频率 系数 ) , 非 相关 变换 系数 对 压缩 极为 重要 。 

2. 量化 与 遂 量 化 

在 编码 之 前 先 对 变换 系数 进行 量化 ,量化 降低 了 用 以 表示 每 一 个 DCT 系数 。 在 量化 过 程 
中 可 以 根据 人 类 视觉 的 生理 和 心理 特点 分 别 作 不 同 策略 的 量化 处 理 。 例 如 ,对 低频 系数 细 量 
化 ,对 高 频 系 数 粗 量 化 ,使 大 部 分 幅 值 较 小 的 系数 在 量化 后 变 为 零 , 然 后 只 剩 下 一 小 部 分 系数 
需要 存储 ,从 而 大 大 压缩 了 数据 量 。 量 化 的 过 程 就 是 每 个 DCT 系数 除 以 各 自 的 量化 步 长 并 取 
整 ,然后 得 到 量化 后 的 系数 : 


F Dos) «aues ES (9-40) 
在 JPEG 标准 中 采用 线性 均匀 量化 器 ,均匀 量化 的 定义 为 ,对 64 个 DCT 变换 系数 , 除 以 对 


应 的 量化 步 长 ,四 舍 五 入 取 整 。 
逆 量 化 是 在 解码 需 中 由 量化 系数 恢复 DCT 变换 系数 的 过 程 : 


P(u,v) =F (u,s) S(u,v) (9-41) 
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由 前 面 的 学 习 了 解 到 ,人 有 眼 视觉 系统 的 频率 响应 , 随 空间 频率 的 增加 而 下 降 , 且 对 于 色 
度 分 量 的 下 降 比 亮度 分 量 要 快 。 为 此 ,JPEG 为 亮度 分 量 和 色 度 分 量 分 别 推荐 了 量化 表 , 提 
高 压缩 比 的 同时 减少 图 像 失 真 。 量 化 器 步 长 是 量化 的 关键 ,量化 步 长 最 佳 的 值 是 由 输入 图 
像 及 图 像 显 示 设 备 的 特性 来 决定 的 ,JPEG 标准 给 出 了 一 个 参考 标准 量化 表 , 如 表 9-1 和 
表 9-2 所 示 。 


亮度 量化 表 表 9-1 


DS exce 3-4 
14 p 35 e 24 40 57 69 56 
24 64 81 104 113 92 























3. 对 量化 系数 的 编码 

对 于 由 量化 器 输出 的 量化 系数 ,JPEG 采用 定常 和 变 长 相 结合 的 编码 方法 ,对 于 DC 系数 
和 AC 系数 的 编码 ,由 于 两 者 的 统计 性 质 上 有 很 大 的 不 同 ,所 以 要 分 开 进 行 。 

(1) 直 流 (DC) 系 数 

由 于 图 像 中 相 邻 的 两 个 图 像 块 的 DC 系数 一 般 很 接近 ,所 以 JPEG 对 量化 后 的 DC 系数 
采用 无 失真 DPCM 编码 , 即 对 当前 块 的 DC 系数 F,(0,0) 和 已 编码 的 相 邻 块 DC 系数 
F, ,(0,0) 的 差 值 进行 编码 。 


AF(0,0) 2 F,(0,0) - F,.,(0,0) (9-42) 


按照 其 取 值 范围 ,JPEG 将 差 值 分 为 12 类 ,如 表 9-3 所 示 。 
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DC 325 (& RO A Ai 02 Zi Hg 表 9.3 
8 -255 ~ -128 ,128 - 255 
9 S11 = -256,256 -511 






-1023 ~ -512,512 ~ 1023 








-15 ~ -8,8 ~15 10 
-31 ~ -16,16 ~31 1 


(2) 交 流 (AC ) 系 数 
Z 型 扫描 ( 系数 的 重新 排列 ) :因为 经 过 量化 以 后 ,AC 系数 中 出 现 较 多 的 0, 所 以 JPEG $ 
用 对 0 系数 的 游程 长 度 编 码 , 即 将 所 有 AC 系数 表示 为 : 


Gi £6 DES D3655 00--:0X,00---0X, -:,00---0X, (9-43) 


Q £6): 7Du uu 其 中 ,X 表示 非 0 (B. AFA MAE O 值 x 组 成 一 
GG GHG GH GH 由 个 编码 的 基本 单位 ,连续 零 的 个 数 越 多 ,编码 效率 就 越 高 。 
E Z ZAA ZAA 因此 ,根据 DCT 系数 量化 后 的 分 布 特点 ,对 DCT 系数 采取 如 
e ef ef oí A gf AA E 9-12 BREUI Z BE-HROE GS, MERER RE T ANO 
af ef ef ef er af af q 值 能 够 连 起 来 ,出 现 更 多 的 连 零 。 

Aii 3 :对 于 连 零 ,可 以 用 其 游程 即 个 数 表 示 。 同 DC 系 
O Z PEE EEP 数 差 值 编码 类 似 ,JPEG 将 AC. 系数 中 非 0 值 也 分 为 表 9-4 所 
O9 CI CO CO 示 的 10 类 , 即 用 自然 二 进 制 码 表示 非 0 值 所 需 的 最 小 比 





-2047 ~ —1024,1024 ~ 2047 





图 9-12 ZA f 特 数 。 
AC 系数 符号 2 B8 IR RO SR] x 9-4 

类 H 取 值 类 W 取 值 

1 -1,1 aaee d -63 ~ 32,32 ~ 63 

2 -3, -2,2,3 -127 ~ -64,64 ~ 127, 

3 age ad pug eh -255 - -128,128 - -255 

4 -15- -8,8-15 mE GNE -511 ~ -256,256 - 511 

5 -31 ~ -16,16 ~31 -1023 ~ -512,512 ~ 1023 
于 是 ,可 将 一 个 基本 编码 单位 表示 为 : 

(符号 1, 符 号 2) (9-44) 


其 中 符号 2 为 实际 非 0 值 , 它 表 示 的 是 非 零 的 AC 系数 的 幅 值 ;符号 1 为 游程 /类 别 , 即 游 
程 和 类 别 的 组 合 ,“ 游 程 ”表示 “2Z” 字 形 排列 顺序 的 非 零 系 数 前 的 零 值 系 数 的 个 数 。“ 类 别 " 表 
示 对 非 零 系数 编码 的 比特 数 , 即 对 符号 2 编码 的 比特 数 。 
与 DC 系数 的 编码 类 似 , 对 符号 1 编码 方法 采用 霍 夫 曼 编码 ,JPEG 同样 为 亮度 和 色 度 分 
量 推荐 了 和 霍 夫 曼 码 表 , 对 符号 2 也 是 采用 自然 二 进 制 码 。JPEG 还 另外 设 了 两 个 专用 符号 :一 
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个 是 “ZRL” ,作为 符号 1 的 一 种 ,表示 游程 为 16 ,在 游程 大 于 或 等 于 16 时 ,可 使 用 一 个 或 多 个 
“ZRL” ,外 加 一 个 普通 的 符号 1; 男 一 个 为 “EOB” , 即 块 结束 标志 ,表示 该 图 像 块 中 剩余 系数 都 
为 0。 

随 着 网 络 的 发 展 ,JPEG 出 现 了 如 下 问题 ; 

(1) 在 码 率 低 于 0.25bit/ 像 素 时 ,图 像 会 出 现 明显 的 方块 效应 。 

(2) 不 能 在 单一 码 流 中 实现 有 损 和 无 损 压 缩 , 从 而 实现 从 有 损 到 无 损 的 累进 式 传输 。 

(3) 不 适用 于 计算 机 图 形 和 二 值 文本 的 压缩 。 

(4) 抗 噪 能力 差 。 

为 了 弥补 这 些 不 足 ,JPEG2000 标准 于 2000 年 正式 推出 。JPEG2000 使 用 离散 小 波 变换 
(DWT) 作 为 变换 编码 方法 ,对 变换 后 的 DWT 系数 进行 量化 ,再 做 信 编 码 , 最 后 根据 需求 将 炳 
编码 后 的 数据 组 织 成 压缩 流 码 输出 。 整 形 的 离散 小 波 变换 可 以 实现 图 像 从 有 损 到 无 损 的 渐进 
传输 , 且 离 散 小 波 变换 针对 整 幅 图 像 操 作 ,不 存在 方块 效应 的 问题 。 

在 焙 编 码 阶段 ,JPEG2000 采用 基于 上 下 文 的 自 适 应 算术 编码 取代 霍 夫 曼 编码 ,增强 了 压 
缩 效 率 。 算 术 编 码 形成 的 戏 入 式 码 流 不 仅 可 对 图 像 进 行 目 标 码 率 的 压缩 ,还 可 提高 信 品 比 , 可 
分 级 传输 。 因 此 可 以 预见 , 随 着 网 络 的 发 展 ,JPEG2000 将 逐渐 成 为 主流 的 压缩 格式 。 

9.6.2 ”应 用 举例 


以 下 是 取 自 图 像 “Lena” 的 一 个 8 x8 的 方块 . 
139 144 149 153 155 155 155 155 
144 151 153 156 159 156 156 156 
150 155 160 163 158 156 156 156 
159 161 162 160 160 159 159 159 
IGJ) i = (9-45) 
159 160. 161 162- 162 155 155 155 
161 161 161 161 160 157 157 157 
162. 162 16L 163 162 157 157 157 | 





162 162 161 161 163 1158 158 258 
1. 编码 
对 这 块 图 像 进行 JPEG 标准 的 编码 过 程 如 下 。 
(1)FDCT 
经 过 FDCT JA , (8 S HAE. BOB ED. 
oo s) d^ sso 0. cu 3 
EX cp au u$ Ww xl 


-11 -9 -2 2 0 -1 -1 0 
ES TR 7 -2 0 1 1 0 0 0 (9-46) 
1 -1 1 2 0 -1 1 
2 0 2 0 -1 1 -1 
-1 0 0 -1 - 0 2 ] -1 
-3 2 -4 -2 2 1 -1 0 


-= m 
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(2) 量 化 
按照 式 (9-40) 可 得 ; 


F(u,v) » 


Pug Wee +0. 5] (9-47) 


进行 量化 ,其 中 SCu,z) 等 于 表 9-1 给 出 的 量化 表 , 得 到 量化 后 系数 矩阵 为 : 


79. vO d 0 0 0] 


| F (u,v)} = (9-48) 


Oc Q oO c (CO C QC 
eO wu OG" eO VI 
Ge X m" Qo | oO GO 
CODE Ue uen UO VIO GO 
C EA Doce EO QD. WE E 
c oO Q co oO' GO O 





(3) 对 量化 系数 的 编码 

对 以 上 结果 做 Z 型 扫描 ,得 到 表 9-5 中 的 第 一 行 ,其 中 左边 第 一 个 数字 为 DC 分 量 。 假 设 
上 一 个 编码 块 的 DC 系数 为 77, 则 DC 系数 差 值 为 2,DC 和 AC 系数 都 可 以 表示 为 (符号 1 , 符 
号 2) 的 形式 ,如 表 中 第 二 行 所 示 。 然 后 ,对 符号 1 分 别 查 霍 夫 曼 码 表 ( 亮度 信和 号 的 DC 系数 差 
BERSERK, TENEN AC 系数 霍 夫 曼 码 表 ) ,并 用 自然 二 进 制 码 表 示 符 号 2 ,得 到 编码 输 
出 码 为 表 中 第 三 行 。 


编码 实例 表 9-5 








E: EE yy 
比特 率 为 ; 

b- EN. - ibit =0. Sbit (9-50) 
2. 解码 


TERES, H Aoc EUREN BT C SRA He ACRES] EREHE T ARI ARES 153 IURU AREE i sc EAH 
同 的 DC 量化 系数 的 差 值 和 AC 量化 系数 ,再 综合 上 一 个 图 像 块 的 解码 结果 ,得 到 DC 量化 系 
数 ,并 经 过 闭 Z 型 扫描 ,恢复 原来 的 排列 方式 。 解 码 后 的 量化 系数 与 编码 器 中 的 一 样 , 仍 为 : 
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79 0 21300: 0 0 
-2 -1 0 00000 
= S] 0 0- 0 0:0. p 
~ 0 0 人 5 人 OO 人 二 人 

| F(u)! = (9-51) 
0 0 0. 0.0 0. 9 0 
0 0 0. 0. .0- 0- 0^ 0 
0 0 0 0 0 0 09 O0 
0 0 0- 0 0-0- 00 

然后 ,利用 与 编码 器 中 相同 的 量化 表 , 对 量化 系数 进行 逆 量 化 ,恢复 出 以 下 DCT 系数 : 
1261 0 -100000 0 
-24 -12 0 0 0 0 O0 

-14 -13 0 0 9 0 Q9 0 
0 0 0 0 0 0 Q0 O0 

|F(u,v)] = (9-52) 
0 0 0 0: 09. 0 0 0 
0 0 0 0. 0 9. 0. .0 
0 0 0 0 (0; 0. 0. 0 
0 0 0 0 0.0. 0. 0 


再 经 过 IDCT 后 ,最终 得 到 解码 输出 的 图 像 块 . 

144 146 149 152 154 156 156 156 

148 150 152 154 156 156 156 156 

155 156 157 158 158 157 156 155 

AA 160 161 161 162 161 159 157 155 
KO! 163 163 164 163 162 160 158 156 pd. 

163 163 164 164 162 160 158 157 

160 161 162 162 162 161 159 158 

158 159 161 161 162 161 159 158 
与 原始 图 像 块 相 比较 ,两 者 数据 大 小 非常 接近 ,其 误差 系数 主要 是 量化 造成 的 。 对 恢复 的 
图 像 块 ,我 们 也 可 采用 对 整 幅 图 像 评 价 的 方法 计算 其 质量 指标 ,例如 ,可 得 到 其 峰值 信 噪 比 为 : 


255: 
:ie; 


A - ADT 


PSNP = 10lg 241. 0(dB) (9-54) 


9.7 本章 小 结 


图 像 压 缩编 码 对 于 图 像 传 输 、 处 理 过 程 具有 重要 的 意义 ,高 质量 的 图 像 压 缩编 码 能 够 在 有 

效 反映 图 像 信息 的 同时 ,通过 分 析 图 像 中 信息 的 相关 性 ,压缩 图 像 中 的 重复 信息 ,减少 图 像 数 

据 存储 空间 ,减轻 图 像 传输 和 处 理 的 压力 。 本 章 详细 介绍 了 图 像 压 缩编 码 的 原理 、 预 测 编码 、 
统计 编码 、 位 平面 编码 的 基本 原理 及 方法 。 
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1. 如 何 评价 一 个 图 像 压 缩 系统 ? 

2. 试 简 述 预测 编码 的 基本 原理 ,并 画 出 原理 框图 。 

3.640 x480 x 8bit 的 数字 化 电视 帧 图 像 , 每 帧 有 1024B 的 描述 结构 ,请 问 220M 存储 空间 
可 以 存 30 帧 /S 的 电视 图 像 多 少 秒 ? 如 果 用 压缩 比 为 4.25 的 无 损 压 缩 算法 结果 又 如 何 ? 

4. 图 像 编码 有 哪些 国际 标准 ? 

5. 简 述 算术 编码 及 其 过 程 。 
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10.1 前 言 


通过 前 几 章 的 学 习 , 对 数字 图 像 处理 与 机 器 视觉 已 经 有 了 一 些 了 解 。 在 当今 信息 时 代 , 无 
论 是 生活 中 常见 的 手机 美 图 ,还 是 交通 信息 监控 系统 ,又 或 者 是 军事 领域 的 目标 识别 与 跟踪 ， 
都 离 不 开 图 像 处 理 与 机 需 视觉 技术 的 应 用 。 这 些 技术 改变 着 人 类 社会 的 生活 和 生产 方式 。 本 
章 以 图 像 去 雾 和 图 像 融 合 技术 ,运动 目标 识别 、 目 标 跟 踪 技 术 为 例 , 介 绍 当前 数字 图 像 处理 与 
机 器 视觉 技术 研究 热点 和 应 用 实例 。 


10.20 AREE 


雾 和 斤 是 两 种 常见 的 天 气 现象 。 根 据 国 际 气象 组 织 的 定义 : 雾 是 由 大 量 贴近 地 表面 空气 
中 悬浮 的 小 水 滴 或 冰晶 组 成 气 溶胶 ,能 使 大 气 水 平 能 见 度 小 于 1000m 的 天 气 现象 。 根 据 相 关 
研究 , 雾 滴 半径 一 般 在 1 ~ 60hm 范围 内 , 雾 的 浓度 取决 于 雾 的 含水 量 和 大 气 中 的 雾 滴 个 数 。 
短 又 称 灰 插 ,是 大 量 极 细微 的 干 微 侍 等 均匀 地 悬浮 在 空气 中 ,使 水 平 能 见 度 小 于 10km 的 天 气 
现象 。 手 大 都 是 由 矿物 灰尘 、 硫 酸 或 硝酸 盐 \ 有 机 化 合 物 、 碳 等 微粒 构成 ,因而 出 现 考 这 种 天 气 
状况 时 ,空气 相对 湿度 并 不 大 , 且 空 气 表现 多 为 微 带 黄 或 者 黑色 。 

近年 来 ,频繁 发 生 的 雾 猎 天 气 不 仅 影响 到 了 人 们 的 身体 健康 ,也 给 户外 图 像 采 集 设 备 带 来 
了 极 大 挑战 。 以 交通 信息 监控 设备 为 例 , 如 图 10-1 中 所 示 , 雾 独 天 气 下 图 像 采 集 设 备 受 空气 
中 的 粉尘 、 雾 珠 对 光线 的 折射 和 散射 影响 ,获得 图 像 往往 质量 不 高 ,这 些 图 像 中 含有 大 量 噪声 ， 
图 像 边缘 不 突出 , 且 整 体 偏 暗 ,图 像 对 比 度 低 , 难 以 获取 图 像 中 的 有 效 信息 。 为 了 提高 雾 儿 天 
气 下 采集 到 的 图 像 质量 ,图 像 去 雾 技 术 应 运 而 生 。 

图 像 去 雾 是 数字 图 像 处 理 技 术 中 最 重要 的 应 用 之 一 ,在 提高 卫星 遥感 图 像 和 交通 监控 图 
像 质量 等 方面 有 着 重要 意义 。 特 别 是 在 交通 监控 领域 ,图 像 去 雾 技术 能 够 提高 雾 独 天 气 下 监 
控 设 备 采集 到 交通 图 像 的 质量 ,这 对 于 提高 交通 信息 监控 系统 的 稳定 性 ,提高 道路 运输 的 安全 
性 等 级 ,提高 交通 管理 水 平 的 信息 化 程度 有 着 重要 的 作用 。 

10.2.1 数字 图 像 去 雾 概述 

在 天 气 状况 良好 的 情况 下 ,空气 中 以 半径 微小 的 氮 、 氧 ,水 蒸气 和 极 少 的 固体 悬浮 物 为 主 ， 
各 种 微粒 对 光线 影响 非常 小 ,因而 图 像 采 集 设 备 获 取 的 图 像 质量 也 比较 高 。 由 雾 儿 的 定义 可 
以 看 出 , 雾 和 二 这 两 种 天 气 现象 都 是 由 空气 中 出 现 较 多 半径 相对 较 大 的 悬浮 微粒 造成 的 。 大 
气 中 这 些 悬 浮 的 微粒 ,对 光线 传输 有 很 大 的 影响 ,根据 Nayar 和 Narasimhan 等 人 对 成 像 模 型 的 
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研究 ,其 中 对 光线 影响 最 大 的 为 散射 作用 。 





a) 含 雾 交 通 图 像 1 b) 含 雾 交 通 图 像 2 
图 10-1 FERI FER 
雾 独 天气 下 空气 中 悬浮 的 颗粒 物 密度 很 大 , 即 悬 浮 颗 粒 物 之 间 的 臣 离 很 近 , 但 是 相对 于 颗 
粒 物 来 说 间隔 还 是 足够 大 的 ,因此 ,可 以 认为 悬浮 颗粒 物 都 是 独立 的 散射 体 。 每 个 颗粒 物 在 散 
射 过 程 中 ,接受 直射 光 的 同时 ,也 会 对 经 过 其 他 微粒 二 次 或 多 次 散射 后 的 光线 再 次 散射 。 雾 手 
天 气 下 ,空气 中 悬浮 颗粒 物 对 成 像 的 影响 过 程 如 图 10-2 中 所 示 。 





图 10-2 ” 雾 独 对 成 像 的 影响 过 程 


因此 , 受 空气 中 的 小 水 滴 、 固 体 颗粒 物 影响 ,图 像 采集 设备 采集 到 的 光线 是 衰减 之 后 的 ,而 
光线 的 衰减 程度 与 物体 到 图 像 采集 设备 的 距离 有 关 , 不 依赖 其 他 设备 的 情况 下 ,图像 中 深度 信 
息 是 未 知 的 。 因 而 ,在 依托 单 幅 图 像 实现 去 雾 时 ,已 知 的 信息 实在 太 少 , 图 像 去 雾 是 一 项 非常 
有 挑战 性 的 问题 。 

10.2.2 ”第 见 的 图 像 去 雾 方法 

随 着 图 像 去 雾 技术 的 发 展 ,目前 国内 外 图 像 去 雾 的 主流 方法 从 原理 上 大 致 可 分 为 两 类 :一 
类 是 图 像 增 强 的 方法 ,一 类 是 图 像 复 原 的 方法 。 

1. 基 于 图 像 增强 的 方法 

基于 图 像 增强 的 去 雾 方法 忽略 了 图 像 降 质 过 程 ,通过 提升 含 雾 图 像 的 对 比 度 和 色彩 饱和 
程度 ,或 通过 边缘 锐 化 来 突出 场景 中 物体 的 边缘 信息 ,进而 提高 图 像 在 可 见 光 频 段 的 感官 效 
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果 。 常 见方 法 有 基于 直方 图 均衡 化 的 去 雾 算 法 ,基于 同 态 滤波 的 去 雾 算 法 ,基于 小 波 变换 的 去 
雾 算 法 ,基于 Retimex 增强 的 去 雾 方 法 ,这 里 对 这 几 种 方法 进行 简单 介绍 。 

(1) 基 于 直方 图 均衡 化 的 的 图 像 去 雾 

基于 直方 图 均衡 化 的 去 雾 算法 是 通过 统计 原 含 雾 图 像 中 像素 的 分 布 , 得 到 原始 直方 图 分 
布 图 ,根据 去 雾 需要 ,选择 灰 度 变换 区 间 ,通过 将 区 间 内 的 灰 度 映 射 到 某 一 目标 区 间 ,改变 图 像 
原来 的 灰 度 分 布 ,从 而 提高 图 像 对 比 度 。 其 中 代表 算法 就 是 全 局 直方 图 均衡 化 算法 。 由 于 该 
算法 并 没有 针对 图 像 中 的 不 同 区 域 的 信息 ,而 是 对 整 幅 图 像 统 一 进行 均衡 化 操作 ,在 场景 较为 
单一 的 雾 狗 图 像 中 能 取得 比较 好 的 去 雾 效 果 ,但 是 对 于 场景 复杂 的 雾 才 图 像 ,这 一 方法 因为 在 
局 部 区 域 缺少 针对 性 而 往往 会 丢失 很 多 细节 信息 ,因此 得 到 的 去 雾 图 像 并 不 能 有 效 突出 有 用 
的 信息 。 为 了 解决 这 一 问题 ,T. K. Kim 等 人 基于 传统 的 全 局 直方 图 均衡 化 算法 提出 了 局 部 直 
方 图 均衡 化 及 其 改进 的 算法 ,这 一 方法 的 思路 与 原 有 的 全 局 灰 度 变换 不 同 , 它 只 对 某 些 特殊 区 
域 进 行 灰 度 的 拉 伸 变换 ,同时 在 对 某 一 像素 点 进行 操作 时 还 考虑 了 周围 像素 的 关联 性 ,因而 这 
一 算法 也 称 为 块 重生 直方 图 均衡 化 算法 。 该 算法 较 好 的 保留 了 图 像 细 节 信 息 ,但 该 算法 的 计 
算 量 可 能 是 原来 的 数 倍 ,在 处 理 尺 寸 较 大 的 图 像 时 往往 难以 满足 时 间 要 求 。 为 了 提高 算法 的 
时 效 性 ,将 之 前 算法 设计 成 子 块 不 重生 算法 ,但 这 一 算法 没有 考虑 各 个 子 块 之 间 的 连贯 性 ,处 
理 后 的 图 像 往往 闹 块 比较 明显 , 即 “ 块 效应 ” ,视觉 效果 不 好 ,但 是 这 种 “ 块 操作 "能够 显著 减少 
计算 量 ,在 某 些 要 求 不 高 的 场合 下 也 是 能 够 使 用 的 。 随 后 ,J.Y. Kim 等 人 结合 上 述 两 种 方法 提 
出 了 部 分 子 块 重生 的 算法 ,其 结合 了 子 块 重 释 算 法 处 理 效果 较 好 和 子 块 不 重 全 算法 处 理 速度 
较 快 的 优点 ,同时 又 减少 了 两 种 算法 之 前 的 缺点 ,从 效果 和 实时 性 上 来 讲 这 种 方法 都 有 比较 好 
的 优势 。 此 外 ,还 有 Zimmerman 等 人 提出 的 插值 图 像 均衡 化 算法 ,只 要 对 少量 固定 子 块 采 用 
直方 图 均衡 化 处 理 , 大 大 减少 了 由 于 子 块 重 番 带 来 的 计算 量 较 大 的 问题 ,而 且 在 计算 图 像 中 的 
每 一 个 像素 点 的 直方 图 变换 时 ,可 以 使 用 周围 其 他 子 块 的 变换 函数 来 代替 。Reza A. 等 人 在 前 
面 提 到 的 直方 图 均衡 化 算法 的 基础 上 ,提出 了 对 比 度 受 限 的 算法 。 这 一 算法 首先 将 对 比 度 受 
限 直方 图 进行 灰 度 变换 ,在 各 个 子 块 边缘 ,通过 用 图 像 插 值 的 方法 来 实现 滤波 平滑 操作 ,进而 
突出 图 像 中 的 信息 。 直 方 图 均衡 化 算法 是 早期 图 像 增强 的 基本 算法 之 一 ,衍生 出 了 一 系列 的 
图 像 去 雾 算 法 ,如 图 10-3 所 示 ,对 数字 图 像 去 雾 研 究 的 发 展 有 着 巨大 的 推动 作用 。 





图 10-3 直方 图 均衡 化 去 雾 方法 分 类 
(2) 基 于 同 态 滤 波 的 图 像 去 雾 
同 态 滤波 是 一 种 对 图 像 在 频 域 进行 操作 的 非 线 性 滤波 。 其 理论 基础 是 :照度 和 反射 率 构 
成 了 像素 的 灰 度 信息 ,在 同一 幅 图 片 中 ,与 反射 率 的 变化 程度 相 比 ,照度 的 变化 程度 一 般 较 小 ， 
可 以 视 作 图 像 中 的 低频 成 份 。 反 射 率 受 物体 表面 对 光线 反射 不 同等 因素 的 影响 ,一 般 差异 比 
较 大 ,可 视 作 高 频 成 份 ,进而 分 别 对 像素 点 的 照度 和 反射 率 进行 处 理 。 从 同 态 滤波 的 定义 可 以 
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看 出 ,滤波 操作 时 ,这 种 方法 能 够 结合 频率 过 滤 和 灰 度 变换 。 用 图 像 的 照度 或 反射 率 模型 作为 
在 频 域 操作 的 基础 ,将 图 像 中 的 像素 分 为 低频 区 域 的 照射 分 量 和 高 频 区 域 的 反射 分 量 两 个 部 
分 。 这 样 提高 对 比 度 的 同时 可 以 尽量 保存 图 像 在 亮 和 上 暗 区 域 的 细节 信息 ,从 而 实现 对 图 像 的 
增强 。 同 态 滤波 器 的 基本 处 理 流 程 如 图 10-4 所 示 。 同 态 滤 波 要 进行 傅立叶 变换 和 传 立 叶 逆 
变换 ,计算 耗 时 较 高 ,而 且 只 能 针对 单一 频率 滤 除 ,对 于 多 频率 的 干扰 很 难 去 除 ,在 实际 应 用 中 
具有 较 大 的 局 限 性 。 





图 10-4 同 态 滤波 器 处 理 流程 
(3 ) 基 于 小 波 变换 的 图 像 去 雾 
在 基于 小 波 变换 的 图 像 去 雾 中 ,普遍 认为 图 像 中 含 雾 区 域 主要 在 图 像 的 低频 部 分 ,高 频 相 
对 较 少 ,根据 这 一 论断 ,可 以 对 图 像 的 高 频 和 低频 分 别 增强 或 者 减弱 来 处 理 图 像 。 小 波 变换 是 
在 局 部 窗口 对 时 间 域 和 频率 域 进行 操作 ,能 够 从 信号 中 对 信息 进行 有 效 的 提取 。 通 过 小 波 变 
换 我 们 可 以 得 到 某 一 区 域 的 频谱 信息 ,而 且 自 身 有 能 高 效 描述 图 像 的 平滑 区 域 (低频 区 域 )， 
又 能 有 效 的 描述 图 像 中 突变 的 区 域 ( 高 频 区 域 ) 的 多 分 辩 率 特性 。 那 么 就 可 以 通过 小 波 变换 
来 锐 化 细节 信息 ,进而 实现 使 图 像 清晰 或 者 去 雾 的 目的 。 此 外 ,马云 飞 等 人 也 提出 了 一 种 基于 
小 波 变换 的 雾 天 图 像 阔 值 确定 模型 ,图 像 失真 度 有 很 大 地 降低 ,在 视觉 效果 上 有 很 大 地 提高 。 
这 些 方法 取得 了 一 定 的 效果 略 有 差异 的 去 雾 效果 。 
(4) 基 于 Retinex 理论 的 图 像 去 雾 
1963 年 Edwin Land 等 人 提出 了 Retinex 理论 。 该 理论 用 于 描述 颜色 不 变 的 特性 ,认为 色 
彩 与 照度 无 关 , 只 由 光线 反射 性 质 决 定 , 忽 略 了 周 玮 环境 光照 的 成 份 变化 。 这 一 算法 有 高 动态 
压缩 、 细 节 增 强 .颜色 恒定 和 保 真 等 优点 ,对 因 光 照 不 均 而 引起 的 低 对 比 度 图 像 的 增强 有 不 错 
的 效果 。 在 这 一 理论 的 基础 上 又 衍生 出 很 多 改进 的 算法 ,如 Frankle 等 人 结合 迭代 思想 提出 了 
改进 的 Retinex 算法 ;1997 年 Jobson 等 人 提出 了 单 尺度 Retinex 算法 ,后 来 又 提出 了 多 尺度 
Retinex 算法 。 这 些 都 是 目前 常见 的 基于 这 一 理论 的 算法 ,都 取得 了 较 好 的 去 雾 效 果 。 后 来 ， 
国内 学 者 黄 黎 红 提 出 在 HSV 亮度 空间 采用 中 心 用 可 自 适 应 调节 的 S 型 双 曲 正切 函数 来 代替 
Retinex 的 对 数 函 数 进行 对 比 度 增强 的 方法 ,也 同样 取得 了 不 错 的 效果 。 
2. 基于 图 像 复原 的 去 雾 方法 
虽然 基于 图 像 增 强 的 去 雾 方法 有 时 能 取得 不 错 的 效果 ,但 是 这 类 方法 的 普 适 性 和 稳定 性 
并 不 好 。 同 时 ,由 于 这 类 方法 忽略 了 导致 雾 狂 天气 下 采集 到 的 图 像 降 质 的 原因 和 过 程 , 只 是 改 
善 了 含 雾 图 像 的 视觉 效果 ,从 本 质 上 来 说 并 没有 真正 的 去 雾 。 在 基于 图 像 复原 的 去 雾 方 法 中 ， 
图 像 去 雾 是 从 退化 的 原因 和 过 程 出 发 ,建立 图 像 退化 过 程 的 模型 ,如 图 10-5 中 所 示 。 这 个 降 
质 模 型 可 被 描述 为 无 雾 的 图 像 f(x) 在 受降 质 函 数 
foc e. (089809 10 e SUSRMOS nC) DEA ELATI TB E 
li 后 的 图 像 g(x)。 
nG) FIERE d B 388 XC F P 5 E Jt S Jr A 
图 10-5 图像 退化 的 一 般 模型 建立 图 像 退 化 的 模型 , 反 演 图 像 退化 过 程 ,以 此 来 
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补偿 由 图 像 采集 设备 采集 到 的 雾 者 天 气 下 的 降 质 图 像 ,进而 恢复 出 没有 受到 雾 独 干扰 的 图 像 。 
从 理论 上 讲 。 这 类 方法 能 够 有 效 的 得 到 去 雾 图 像 ,而 且 复 原 出 的 图 像 与 真实 场景 相似 度 较 高 ， 
然而 从 前 面 的 过 程 可 以 明显 看 出 ,实现 图 像 复 原 的 难点 和 重点 在 于 对 降 质 的 退化 函数 和 噪声 函 
数 的 估计 ,一 旦 针对 图 像 退 化 建立 的 模型 不 准确 ,得 到 的 复原 图 像 效 果 就 难以 满足 要 求 。 

目前 ,对 基于 图 像 复原 的 去 雾 方 法 ,国内 外 常见 的 有 以 下 几 类 。 

(1) 已 知 场景 信息 的 复原 方法 

在 雾 才 天气 下 ,空气 中 悬浮 的 小 水 滴 和 固体 颗粒 物 对 光线 的 散射 作用 ,使 得 物体 反射 光 传 
播 到 图 像 采 集 设备 过 程 中 光线 发 生 衰减 ,而 且 周 围 的 环境 光 由 于 散射 也 进入 图 像 采 集 设 备 , 这 
些 因 素 造成 了 图 像 采集 设备 采集 到 的 图 像 对 比 度 下 降 , 一 般 情 况 下 图 像 对 比 度 下 降 的 程度 和 
场景 深度 旦 指数 相关 。Oakley 等 人 建立 了 一 个 有 多 个 参数 的 统计 退化 模型 ,模型 中 考虑 了 外 
界 的 天 气 条 件 对 图 像 成 像 的 影响 ,通过 图 像 数 据 来 估计 模型 参数 ,对 灰 度 场景 进行 可 见 性 复 
原 。 后 来 Tan 等 人 对 上 述 统 计 退 化 模型 进行 了 改进 ,将 其 用 于 彩色 雾 天 图 像 的 可 见 性 复原 ,并 
且 分 析 了 在 雾 休 天气 下 光 的 波长 与 图 像 对 比 度 降低 之 间 的 关系 。 这 些 方法 都 建立 在 已 知 图 像 
场景 深度 的 基础 上 ,一 般 都 需要 用 高 精度 测 距 设备 来 获取 雾 者 天 气 图 像 场 景 的 详细 深度 信息 ， 
这 也 限制 了 这 些 方法 在 实际 中 的 使 用 。 

(2) 利 用 辅助 信息 获取 深度 信息 的 复原 方法 

1999 年 以 来 ,Nayar 和 Narasimhan 等 人 通过 获取 图 像 的 辅助 信息 ,从 多 个 角度 研究 了 场景 
深度 的 获取 方法 ,进而 恢复 出 图 像 。 如 Narasimhan 等 人 提出 了 一 种 二 色 大 气 散 射 模型 ,用 模 
型 描述 了 输入 光 训 减 和 空气 光 成 像 的 过 程 , 用 场景 深度 ,大气 光 和 颜色 的 函数 描述 了 雾 狂 天气 
下 大 气 散 射 作用 下 的 成 像 过 程 。 这 种 方法 需要 通过 几 幅 不 同 天 气 条 件 下 拍摄 的 图 片 ,而 且 需 
要 一 张 同样 场景 下 比较 清晰 的 图 像 ,而 后 用 二 值 散射 模型 来 获取 场景 信息 。 这 类 方法 在 大 气 
散射 模型 的 基础 上 ,将 不 同 天 气 条 件 下 的 相同 场景 的 退化 图 像 作为 辅助 信息 ,因而 ,在 使 用 中 必 
须 有 多 幅 同样 场景 的 图 片 ,但 是 在 实际 中 ,很 多 场景 下 ,例如 实时 监控 等 ,就 无 法 获得 在 不 同 天 气 
条 件 下 的 同样 场景 的 图 像 ,因而 , 受 这 些 限 制 条 件 的 影响 ,这 种 方法 的 可 操作 性 并 不 高 。 

(3) 基 于 先 验 信息 的 复原 方法 

为 了 获得 场景 深度 等 信息 ,前 面 所 述 的 方法 ,使 用 距离 传感器 或 是 利用 同一 场景 不 同 天 气 
条 件 的 图 像 ,都 有 较 大 的 局 限 性 。 最 近 几 年 ,很 多 学 者 将 目光 投向 了 依托 先 验 知识 或 者 假设 的 
单 幅 图 像 去 雾 的 研究 。 例 如 ,按照 雾 者 天 气 下 图 像 的 对 比 度 是 低 于 不 含 雾 狂 图像 的 这 一 理论 ， 
可 以 通过 尽量 增 大 图 像 中 部 分 目标 区 域 的 对 比 度 , 从 而 实现 对 含 雾 图 像 的 可 见 性 复原 ,然后 利 
用 马尔 可 夫 随 机 场 ,对 所 得 结果 归 一 化 处 理 。 这 种 方法 有 时 能 够 很 好 的 突出 图 像 细 节 , 但 是 由 
于 单纯 提高 对 比 度 , 会 使 结果 图 像 的 饱和 度 偏 高 ,而 且 在 景深 突变 的 边缘 区 域 效果 并 不 理想 ， 
但 是 这 一 假设 却 为 后 来 其 他 算法 的 提出 提供 了 研究 基础 。 

Fattal 提出 了 通过 估计 和 雾 天 图 像 场 景 辐射 率 独立 分 量 分 析 的 可 见 度 复原 方法 。 这 种 方法 
假设 局 部 窗口 的 反射 率 是 常数 ,目标 场景 的 表面 反射 率 和 传输 率 在 局 部 窗口 中 是 独立 的 ,使 用 
马尔 可 夫 随 机 场 推 断 图 像 的 颜色 ,一 般 情 况 下 能 够 得 到 较为 准确 的 复原 图 像 , 但 是 这 种 方法 以 
颜色 统计 为 基础 ,由 于 非常 依赖 颜色 信息 ,所 以 对 雾 比较 浓 、 色 彩 偏 瞳 的 图 像 恢复 出 的 清晰 度 
难以 满足 需要 。 

何 恺 明 等 人 在 以 上 研究 基础 上 ,通过 大 量 图 像 统计 分 析 ,发 现在 对 不 含有 天 空 的 清晰 图 像 
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的 区 域 中 , 取 像 素 RGB 的 最 小 值 ,总 是 趋向 于 0, 称 其 为 图 像 中 的 暗 通 道 。 那 么 ,将 这 一 信 
息 作 为 先 验 信息 来 估计 大 气 光 和 透射 率 ,再 通过 软 抠 图 对 得 到 的 透射 率 的 粗 估计 来 进行 滤波 ， 
得 到 精确 的 透射 率 ,这 样 就 可 以 利用 雾 革 天气 下 成 像 模 型 来 恢复 出 清晰 图 像 。 一 般 情况 下 ,这 
一 方法 能 够 取得 不 错 的 去 雾 效 果 , 但 如 果 图 像 中 没有 暗 通 道 , 这 种 方法 就 不 能 使 用 了 ,而 且 软 
抠 图 的 计算 量 十 分 巨大 ,限制 了 这 一 方法 的 使 用 。 后 来 又 有 人 提出 用 双边 滤波 来 代替 软 抠 图 
优化 透射 率 的 方法 ,取得 了 不 错 的 效果 。 

10.2.3 ”基于 暗 通道 先 验 的 图 像 去 雳 算法 

基于 图 像 增强 的 去 雾 算法 ,通常 是 通过 增强 局 部 的 对 比 度 ,增强 或 者 抑制 图 像 中 某 些 信息 
从 而 实现 去 雾 。 这 种 算法 只 是 对 图 像 中 有 用 信息 进行 增强 ,从 本 质 上 来 说 并 没有 去 雾 ,而 在 基 
于 大 气 散 射 模型 的 图 像 去 雾 算 法 中 ,通过 对 光线 在 大 气 中 传播 和 衰减 过 程 建 立 图 像 退 化 模型 ， 
再 根据 图 像 的 退化 模型 推出 原始 图 像 。 显 然后 者 更 加 可 靠 ,去 雾 效 果 更 加 稳定 。 本 节 将 以 基 
于 暗 通道 先 验 理论 的 去 雾 算法 为 例 来 介绍 基于 图 像 退化 模型 的 图 像 复 原 方法 。 

(1) 雾 斤 天 气 下 图 像 的 退化 模型 

Nayar 和 Narasimhan 等 人 根据 光线 成 像 过 程 中 的 输入 光 衰 减 和 空气 光 成 像 过 程 造成 雾 考 
天 气 下 图 像 对 比 度 低 、 模 糊 不 清 等 问题 ,利用 这 两 个 过 程 的 数学 模型 ,用 场景 深度 、 大 气 光 和 颜 
色 的 函数 描述 雾 手 天 气 下 大 气 的 散射 作用 的 成 像 过 程 ,建立 雾 独 天气 下 图 像 退 化 模型 。 

雾 独 天气 下 图 像 采 集 设 备 端 接受 到 的 光线 强度 可 以 等 效 为 目标 场景 中 光线 发 生 误 减 之 后 
到 达 镜 头 的 光 的 强度 和 散射 的 大 气 光 在 经 过 衰减 后 到 达 镜 头 的 光 强 度 友 加 ,那么 雾 狂 天 气 下 
图 像 采 集 设备 采集 到 的 光线 数学 模型 , 即 图 像 退化 模型 可 以 表示 为 : 

I(x) 2J(x)t(x) +4[1 -i(x)] (10-1) 

式 中 ,J(x) 代 表 图 像 采集 设备 端 采集 到 的 光线 ;ix ) 称 为 传播 率 (透射 率 ) 反映 光线 穿 透 
雾 仁 的 能 力 ,含有 景深 信息 ,一 般 取 值 在 0 到 1 之 间 ;7(x) 代 表 物 体 表面 的 反射 光 强 , 即 未 衰减 
的 光线 ;4 代表 大 气 光 强 , 即 无 穷 远 处 的 光照 强度 。 

(2) 暗 通道 先 验 理论 

暗 通 道 先 验 理论 是 何 恺 明 等 人 于 2009 年 率先 提出 的 。 在 图 像 去 雾 研究 时 , 何 恺 明 等 人 在 
收集 了 大 量 的 无 雾 图 像 后 发 现 , 绝 大 部 分 室外 无 雾 图 像 在 任意 的 局 部 小 块 中 ,总 存在 一 些 像 
素 , 他 们 的 某 一 个 或 者 几 个 颜色 通道 的 值 都 很 小 , 即 图 像 中 存在 暗 通道 。 以 RGB 颜色 空间 的 
图 像 为 例 , 暗 通道 可 以 用 以 下 数学 式 表 示 。 


J** (x) = min ( min J'(y)) (10-2) 
y(x) celr,g,bl 


式 中 ,e 代表 某 一 颜色 通道 ;x 为 某 局 部 区 域 ;y 是 局 部 区 域内 某 一 点 的 位 置 ;Jj““(x) 是 这 
一 局 部 区 域 的 暗 通道 值 ,由 此 得 到 原 图 像 的 暗 通道 图 像 。 如 图 10-6 中 所 示 , 图 10-6a ) ARE 
雾 者 的 清晰 图 像 ,图 10-6b ) 为 相应 的 暗 通 道 图 像 。 

通过 进一步 统计 发 现 , 不 含 雾 革 的 清晰 图 像 的 上 暗 通 道 图 像 中 亮度 为 0 的 像素 点 占 所 有 像 
素 的 8096 以 上 ,而 且 像 素 的 亮度 分 布 随 着 亮度 的 增 大 而 急剧 减少 ,也 就 是 说 ,统计 规律 表明 无 
雾 图 像 中 的 暗 通道 基本 趋向 于 0, 这 个 统计 结果 说 明了 暗 通 道 的 客观 存在 性 。 

含 雾 图 像 及 其 对 应 的 暗 通 道 图 像 如 图 10-6c) .d) 所 示 ,与 清晰 图 像 的 暗 通 道 整 体 趋 于 0 

= = 





第 10 3€ — 机 器 视觉 应 用 算法 实例 


不 同 , 含 雾 图 像 由 于 受到 雾 儿 影响 ,图像 整体 偏 灰 白 , 暗 通道 图 像 中 这 些 像素 点 的 亮度 也 会 变 
高 ,整体 比 不 含 雾 狂 的 暗 通道 图 像 中 像素 点 的 亮度 更 高 , 且 雾 越 浓 的 区 域 ,对 应 的 瞳 通道 图 像 
越 亮 。 由 此 得 到 图 像 的 景深 信息 ,将 平面 图 像 中 的 信息 还 原 为 立体 的 ,有 深度 的 信息 ,这 对 于 
单 幅 图 像 去 雾 是 十 分 有 价值 的 。 






b) 对 应 暗 通道 图 像 





EEIT dX SOROR PER 
图 10-6 图 像 及 其 暗 通道 图 像 

(3 ) 透射 率 及 大 气 光 的 参数 估计 

根据 前 面 图 像 退化 模型 的 描述 ,可 知 去 雾 的 重点 就 是 估计 出 大 气 光 强 4 及 透射 率 t(x), 
利用 已 含有 雾 的 图 像 I(x) ,根据 式 (10-1) 变形 ,可 以 得 到 去 雾 后 图 像 为 ; 

x) -A|1 -t(x 
JG) - 2 TS (x)] 

显然 ,只 凭借 一 幅 图 像 求 取 三 个 未 知 数 ， boue 此 时 ， 可 以 使 用 暗 通道 理论 来 作为 
求解 的 约束 条 件 , 估 计 所 需 的 参数 。 主 要 思路 是 :通过 求解 含有 雾 者 图 像 的 暗 通道 ,依靠 暗 通 
道 图 像 中 反映 的 雾 的 浓度 和 景深 变化 的 信息 poer idum x) ,和 大 气 光 强 4, 进 而 求 
解 出 复原 网 像 。 

其 中 ,大 气 光 强 4 采用 暗 通 道 图 像 中 亮度 较 高 的 一 部 分 像素 的 值 作为 其 估计 值 ,透射 率 1(x) 
的 估计 为 式 (10-4) ,其 中 为 o 常 系数 ,c RGB 的 某 一 颜色 通道 ,y 为 属于 区 域 x 的 某 一 像 





(10-3) 





t(x) z1 -o min | min E o) | (10-4) 


yeQ(x) A' 


c= AI — 
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具体 步骤 如 下 : 

a. 求 取 图像 的 瞳 通 道 。 利 用 前 面 所 述 的 暗 通道 求 取 公式 求解 各 个 像素 块 内 的 瞳 通道 值 ， 
首先 将 含 雾 图 像 Kx ) 分 为 小 块 的 局 部 图 像 , 这 里 以 15 x 15 像素 块 为 例 来 计算 ; 

b. 使 用 透射 率 估计 公式 求 得 整 幅 图 像 的 透射 率 的 粗 估计 ; 

c. 利用 暗 通道 图 中 的 明亮 点 估计 出 大 气 光 强 A; 

d. 用 软 抠 图 方法 (或 者 其 他 滤波 方法 ,如 双边 滤波 .引导 滤波 等 ) 对 得 到 的 图 像 透 射 率 的 
粗 估计 精细 化 ; 

e. 利用 建立 的 图 像 退 化 过 程 模型 恢复 出 去 雾 后 的 图 像 J(x) 。 

基于 暗 通道 先 验 原理 的 去 雾 流 程 如 图 10-7 中 所 示 。 





大 气 光 估计 


图 10-7 ”上 暗 通道 先 验 去 雾 算法 流程 
(4) 基 于 暗 通 道 先 验 的 去 雾 算法 Matlab 实现 及 去 雾 结果 
鉴于 滤波 算法 种 类 繁多 ,上 且 有 大 量 的 参考 资料 ,以 下 我 们 只 给 出 图 像 暗 通道 求 取 方 法 的 
Matlab 实现 。 


中 暗 通道 求 取 Matlab 实现 
function dark = darkChannel ( imRGB ) 
r ZimRGB( ;, :,1); % 分 别提 取 图 像 的 三 个 通道 


g -imRGB( :,:,2); 
b zimRGB( :,:,3); 


[m,n] -size(r) ; 9o 获取 图 像 的 尺寸 

a =zeros(m,n); 

fori-l:m % 计 算 图 像 的 暗 通 道 
for ] =1:n 


a(i,j) 2 min(r(i,j) ,g(i,j) ); 
a(i,j) 2 min(a(i,j) ,b(i,j)) ; 
end 
end 
d = ones(15,15) ; 96 HHE 
20332: 
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fun = @ (block_struct)min( min( block, struct. data) ) * d; 

dark = blockproc(a, [15 15] ,fun) ; 

dark = dark(1:m, 1;n); 

@) 去 雾 效果 分 析 

实验 中 采用 的 是 基于 暗 通道 先 验 的 双边 滤波 去 雾 算法 ,按照 图 10-7 中 所 述 的 图 像 去 雾 流 
程 进行 处 理 , 效 果 如 图 10-8 所 示 。 图 10-8a ) 为 雾 者 天 气 下 采集 到 的 降 质 图 像 ,显然 图 像 色 彩 
饱和 度 、 对 比 度 比较 低 , 图 像 边缘 不 够 清晰 。 对 图 10-8a) 进行 去 雾 处 理 ,图 10-8b ) 为 原 图 像 的 
瞳 通道 图 像 ,图 10-8e ) 为 去 雾 后 所 得 的 图 像 。 对 比 去 雾 前 后 图 像 可 以 发 现 ,去 雾 后 图 像 清晰 
度 和 色彩 饱和 度 有 了 很 大 提升 。 





a 原 图 Lo — D 原 图 像 的 瞳 通道 图 像 





c) Xs 
图 10-8 ”图像 去 雾 结果 


10.3 图像 融合 


图 像 融合 技术 是 信息 融合 技术 的 重要 分 支 , 绪 合 了 传 感 吉 图 像 处 理 、 信 号 处 理 、 计 算 机 和 
人 工 智 能 等 高 新 技术 。 它 主要 是 指 将 两 个 或 两 个 以 上 的 传感器 在 同一 时 间或 不 同时 间 获 取 的 
关于 某 个 具体 场景 的 图 像 或 图 像 序列 信息 加 以 综合 ,以 生成 新 的 有 关 此 场景 的 解释 信息 。 通 
过 图 像 融 合 技术 可 以 有 效 地 综合 各 传感器 的 互补 优势 ,最 大 限度 地 获取 对 目标 或 场景 信息 的 
完整 描述 ,从 而 有 利于 目标 定位 ` 识 别 和 解释 。 在 医学 测量 地 理 信息 系统 .工业 智能 机 器 人 
以 及 军事 等 领域 都 起 着 重要 的 作用 。 
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10.3.1 图 像 融合 技术 概述 

1. 图 像 融合 的 定义 

Pohl 和 Genderen 等 人 将 图 像 融 合 定义 为 ,图像 融合 就 是 通过 一 种 特定 算法 将 两 幅 或 多 
幅 图 像 合成 为 一 幅 新 图 像 。” , 主要 思想 是 采用 一 定 的 算法 ,把 工作 于 不 同 波长 范围 .具有 不 同 
成 像 机 理 的 各 种 图 像 传感器 对 同一 个 场景 成 像 的 多 个 图 像 的 信息 融合 成 一 个 新 的 图 像 , 从 而 
使 融合 的 图 像 具 有 更 高 的 可 信和 度 、 较 少 的 模糊 、 更 好 的 可 理解 性 ,更 适合 人 的 视觉 或 者 计算 机 
检测 分类、 识别、 理解 等 处 理 。 多 源 图 像 融 合 比 单 源 图 像 具 有 更 多 优势 ,这 是 因为 多 源 图 像 具 
有 宛 余 性 ,具有 单 源 图 像 无 法 捕捉 的 信息 , 即 多 源 图 像 之 间 具 有 互补 性 ,因此 多 源 图 像 融合 能 
够 从 多 个 视点 获取 信息 ,扩大 时 空 的 传 感 范围 ,提高 观测 的 准确 性 和 和 鲁 棒 性 。 

2. 多 源 图 像 融合 的 层次 分 类 

多 源 图 像 融合 与 经 典 的 单一 图 像 处理 方 法 有 本 质 的 区 别 ,多 源 图 像 融 合 信息 处 理 与 单 图 
像 信 息 处 理 相 比 有 着 更 复杂 的 形式 ,依据 融合 在 处 理 流程 中 所 处 的 阶段 以 及 信息 的 抽象 程度 ， 
多 源 图 像 融合 可 分 为 三 个 层次 :像素 级 (Pixel-level) 、 特 征 级 (Feature-level) 和 决策 级 图 像 融 合 
( Decision-level) 。 融 合 的 层次 不 同 , 所 采用 的 算法 、 适 用 的 范围 也 不 相同 。 图 10-9 给 出 了 图 
像 融合 的 三 个 层次 示意 图 。 





图 10-9 图 像 融合 的 三 个 层次 


(1 ) 像素 级 融合 

像素 级 融合 是 直接 在 原始 数据 层 上 进行 的 融合 ,在 各 种 传感器 的 原始 数据 未 经 预 处 理 之 
前 进行 数据 的 综合 和 分 析 , 这 是 最 低层 次 的 融合 。 像 素 级 图 像 融 合 是 在 严格 配 准 的 条 件 下 ,对 
各 传 感 铝 输出 的 图 像 信号 ,直接 进行 信息 的 综合 与 分 析 , 是 在 基础 层面 上 进行 的 信息 融合 ,其 
主要 完成 的 任务 是 对 多 传 感 髓 目标 和 背景 要 素 的 测量 结果 进行 融合 处 理 。 在 融合 的 三 个 级 别 
中 ,像素 级 融合 尽 可 能 多 地 保留 了 场景 的 原始 信息 ,提供 其 他 融合 层次 所 不 能 提供 的 丰富 、 精 
确 、 可 靠 的 信息 ,有 利于 图 像 的 进一步 分 析 、 处 理 与 理解 ,进而 提供 最 优 的 决策 和 识别 性 能 。 像 
素 级 图 像 融 合 是 目前 在 实际 中 应 用 最 广泛 的 图 像 融 合 方式 ,也 是 特征 级 图 像 融合 和 决策 级 图 
像 融 合 的 基础 。 

(2) 特征 级 融合 

特征 级 融合 属于 中 间 层 次 , 它 先 对 来 自 各 传感器 的 原始 信息 进行 特征 提取 (特征 可 以 是 
目标 的 边缘 方向 形状 、 区 域 等 等 ) ,然后 对 特征 信息 进行 综合 分 析 和 处 理 。 一 般 来 说 提取 的 
特征 信息 应 是 像素 信息 的 充分 统计 量 ,然后 按 特征 信息 对 多 传感器 数据 进行 分 类 汇集 和 综 
— 354 — 
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合 ; 传 感 器 获得 的 数据 是 图 像 数 据 ,而 特征 是 从 图 像 像素 数据 中 抽象 提取 出 来 的 ,所 谓 “ 主 要 
特征 "是 通过 对 图 像 数 据 进 行 空间 /时 间 上 的 分 割 等 处 理 获 得 的 ,而 “复合 特征 ”通过 对 现 有 各 
特征 的 综合 得 到 的 。 一 般 从 源 图 像 中 提取 的 典型 特征 信息 有 : 线 型 .边缘 、 角 纹理 光谱、 相似 
亮度 区 域 .相似 景深 区 域 等 。 在 特定 环境 下 的 特定 区 域内 ,多 传感器 图 像 均 具有 相似 的 特征 ， 
说 明 这 些 特征 实际 存在 的 可 能 性 极 大 ,对 该 特征 的 检测 精度 也 可 大 大 提高 。 特 征 级 融合 的 优 
点 在 于 既 保 留 了 足够 数量 的 重要 信息 ,又 可 对 信息 进行 压缩 ,有 利于 实时 处 理 ,适合 在 机 器 视 
觉 中 广泛 使 用 。 

(3) 决 策 级 融合 

决策 级 融合 是 一 种 高 层次 融合 ,其 结果 为 指挥 控制 决策 提取 依据 。 决 策 级 图 像 融合 采用 
大 型 数据 库 和 专家 决策 系统 ,模拟 人 的 分 析 、 推 理 过 程 ,是 建立 在 图 像 理解 基础 上 的 融合 。 它 
首先 对 源 图 像 进行 目标 特征 提取 ,再 对 其 中 有 价值 的 信息 运用 判决 准则 加 以 判断 、 识 别 和 分 
类 ,然后 在 一 个 更 为 抽象 的 层次 上 ,将 这 些 有 价值 的 信息 进行 融合 获得 综合 的 决策 结果 。 

决策 级 图 像 融 合 具 有 实时 性 好 的 优点 ,而 且 当 一 个 或 几 个 传感器 失效 时 ,其 仍 能 给 出 最 终 
的 正确 决策 ,因此 具有 良好 的 容错 性 。 但 其 预 处 理 代价 较 高 ,图像 中 原始 信息 的 损失 最 多 。 决 
策 级 图 像 融 合 处 理 的 数据 信息 量 大 大 地 减少 ,对 通信 及 传输 要 求 低 ,例如 遥感 图 像 决策 级 融合 
只 要 求 源 图 像 中 具有 地 物 的 数据 信息 ,不 需要 传感器 是 同 质 的 。 在 决策 级 融合 的 过 程 中 ,能 够 
对 一 个 或 若干 个 传感器 数据 的 干扰 通过 适当 的 融合 方法 予以 消除 ,而且 由 于 前 期 在 数据 选择 
的 时 候 进行 了 充分 的 分 析 ,能 够 全 方位 的 反映 目标 及 环境 的 信息 ,满足 不 同 应 用 的 需要 。 决 策 
级 融合 方法 主要 是 基于 认 知 模型 的 方法 ,需要 大 型 数据 库 和 专家 决策 系统 ,进行 分 析 、 推 理 、 识 
别 和 判决 。 

上 述 三 个 层次 的 图 像 融 合 与 多 传感器 信息 融合 的 三 个 层次 有 一 定 的 对 应 关系 ,在 实际 应 
用 中 ,要 根据 具体 的 需要 并 结合 不 同 层次 融合 的 特点 进行 选择 ,以 获得 最 优 的 融合 结果 。 已 有 
的 理论 和 研究 表明 ,以 上 三 个 图 像 融 合 的 层次 中 ,像素 级 图 像 融 合 在 预 处 理 、 信 息 损失 、 分 类 性 
方面 性 能 最 优 ,特征 级 和 决策 级 融合 性 能 较 差 。 但 像素 级 图 像 融合 对 传感器 的 依赖 性 最 高 、 系 
统 容 错 性 差 、 处 理 过 程 最 复杂 ,容易 受 噪 声 的 影响 。 像 素 级 图 像 融 合 是 最 基本 的 图 像 融 合 方 
法 ,其 融合 图 像 包 含 的 信息 量 最 多 、 目 标 辨识 性 好 ,在 下 面 几 节 着 重 介 绍 。 三 种 融合 层次 比较 
见 表 10-1。 


三 种 融合 层次 比较 表 10-1 


融合 层次 
像素 级 
特征 级 
决策 级 


目前 ,图 像 融 合 技术 的 研究 虽然 有 了 一 定 的 发 展 , 但 总 的 来 说 依 然 刚 刚 起 步 , 还 有 许多 问 

题 需要 解决 。 首 先 , 图 像 融 合 技术 还 没有 形成 一 个 统一 的 数学 模型 框架 ,因此 建立 一 个 统一 的 
理论 框架 是 图 像 融合 的 一 个 发 展 方向 ;其 次 ,许多 图 像 融 合 的 应 用 都 在 实时 的 环境 中 ,这 就 要 
求 提高 图 像 融合 的 处 理 速度 ,虽然 目前 有 很 多 针对 不 同 应 用 的 融合 处 理 技术 ,但 这 些 算 法 的 处 
理 速度 都 无 法 达到 实时 标准 。 因 此 ,在 机 咒 视 觉 系统 中 设计 高 效 实时 的 处 理 算 法 是 图 像 融 合 
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技术 未 来 的 发 展 方向 。 

10.3.2 ”像素 级 图 像 融 合 技术 的 流程 

图 像 融 合 的 步骤 大 致 可 分 为 两 个 阶段 : 预 处 理 阶 段 和 融合 阶段 。 预 处 理 阶 段 包括 滤波 BO 
准 。 融 合 阶段 包括 按照 不 同 的 融合 规则 对 图 像 进行 融合 处 理 。 基 本 步骤 如 图 10-10 所 示 。 


融 
合 
结 
果 
应 
用 





图 10-10 图 像 融 合 的 基本 流程 


1. 图 像 融合 预 处 理 

在 图 像 采 集 过 程 中 ,由 于 受到 各 种 因素 (如 传感器 的 位 置 速度 、 光 照 强度 、 随 机 品 声 等 ) 的 
影响 ,实际 获得 的 图 像 往往 包含 上 述 影 响 因 素 的 特征 。 因 此 在 实现 图 像 融 合 之 前 ,往往 需要 对 
通过 不 同 传感器 获得 的 图 像 进行 预 处 理 。 常 见 的 图 像 融 合 预 处 理 方法 主要 有 图 像 去 噪 、 边 缘 
提取 、 图 像 配 准 等 。 

(1) 图 像 去 品 

对 受 污染 的 图 像 直接 进行 融合 ,会 降低 图 像 的 主观 和 客观 质量 ,给 后 续 的 图 像 处 理 和 应 用 
带 来 诸多 不 利 的 影响 ,因此 图 像 去 噪 问题 在 图 像 预 处 理 中 起 着 至 关 重 要 的 作用 。 首 先 分 析 和 
研究 所 处 理 图 像 的 特点 ,然后 针对 各 自 的 特点 采用 合适 的 方法 进行 图 像 的 噪声 去 除 ( 滤波 ) , 
在 尽 可 能 保留 原始 图 像 信息 的 前 提 下 最 大 程度 地 剔除 图 像 噪声 , 即 要 把 每 一 幅 经 过 污染 的 图 
像 数据 通 过 预 处 理 恢复 到 一 个 比较 好 的 结果 。 

(2) 图 像 边 缘 提 取 

在 第 6 章 讲 过 ,边缘 表示 信和 号 的 突变 ,包含 了 图 像 中 大 量 的 信息 ,边缘 检测 是 图 像 分 析 的 
重要 内 容 , 图 像 边缘 具有 能 表征 区 域 的 形状 ,能 被 局 部 定义 以 及 能 传递 大 部 分 图 像 信息 等 许多 
优点 ,因而 边缘 检测 可 以 看 作 是 处 理 许多 问题 的 关键 。 图 像 的 边缘 是 图 像 的 特征 之 一 ,边缘 提 
取 是 图 像 配 准 的 前 期 工作 。 

(3) 图 像 配 准 

来 自 不 同 传感器 的 图 像 ,虽然 描述 的 是 同一 场景 ,但 由 于 传感器 之 间 存 在 着 角度 以 及 视 景 
范围 的 不 同 ,因此 会 产生 一 些 差异 ,造成 这 些 图 像 并 不 是 完全 对 准 的 ,也 就 是 说 一 幅 图 像 的 第 
一 行 像素 (或 第 一 列 ) 对 应 到 另外 一 幅 图 像 中 并 不 是 相同 的 行 (或 列 ) 。 就 好 比 我 们 人 的 眼睛 ， 
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左 眼 和 右 眼看 到 的 视 景 范围 其 实 是 不 同 的 ,也 就 是 说 我 们 大 脑 在 处 理 两 只 眼睛 捕获 的 图 像 时 
也 有 一 个 配 准 的 过 程 。 图 像 配 准 就 是 利用 图 像 中 的 共有 景物 ,通过 比较 和 匹配 ,将 两 幅 图 像 中 
对 应 于 空间 同一 位 置 的 点 联系 起 来 。 图 像 配 准 的 目标 就 是 找到 把 一 幅 图 像 中 的 点 映射 到 男 一 
幅 图 像 中 的 点 的 最 佳 变换 。 因 此 说 图 像 配 准 是 图 像 融合 技术 中 很 重要 的 一 个 环节 ,只 有 经 过 
配 准 后 的 图 像 才 能 进行 有 效 的 融合 。 

2. 图 像 的 融合 

图 像 经 过 除 噪 边缘 检测 配 准 等 预 处 理工 作 之 后 ,就 可 以 进行 融合 处 理 了 ,这 一 步 是 图 像 
融合 的 核心 。 像 素 级 图 像 融合 是 最 基础 的 图 像 融合 , 它 直 接 对 各 传感器 输出 的 图 像 信 号 进行 
信息 的 综合 与 分 析 , 其 主要 完成 的 任务 是 对 多 传感器 目标 和 背景 要 素 的 测量 结果 进行 融合 处 
理 。 在 融合 的 过 程 中 ,关键 点 是 如 何 确定 融合 策略 ,因此 如 何 针对 不 同 图 像 的 特点 不同 应 用 
领域 ,设计 合理 有 效 的 融合 算法 是 本 领域 研究 的 方向 。 

10.3.3 ”像素 级 图 像 融 合算 法 

像素 级 融合 是 特征 级 融合 和 决策 级 融合 的 基础 ,也 是 目前 研究 的 重点 。 像 素 级 融合 的 基 
本 思路 是 通过 求 取 两 幅 图 像 对 应 像素 信息 或 频率 信息 的 组 合 , 获 得 融合 图 像 。 从 融合 技术 发 
展 的 历史 过 程 来 看 ,是 由 简单 到 复杂 、 初 级 到 高 级 的 过 程 。 

多 源 图 像 像素 级 融合 大 致 可 以 分 为 两 类 :基于 空间 域 的 图 像 融合 和 基于 变换 域 的 图 像 融 
合 。 基 于 空间 域 的 图 像 融合 一 般 指 的 是 直接 在 图 像 的 像素 灰 度 空间 上 进行 融合 处 理 , 简 单 的 
加 权 方 法 、 主 成 分 分 析 法 和 基于 HVS( Human Vision System ) 的 图 像 融合 方法 就 是 空间 域 上 的 
图 像 融合 技术 ;基于 变换 域 的 图 像 融 合 是 先 要 对 待 融合 的 多 源 图 像 进 行 图 像 变 换 以 得 到 各 图 
像 分 解 后 的 系数 ,然后 将 变换 后 的 系数 进行 组 合 得 到 一 组 新 的 变换 系数 ,再 进行 反 变 换 得 到 融 
合 图 像 。 

1. 空间 域 融 合 方法 

(1) 加 权 平 均 法 

加 权 平 均 法 是 图 像 空 间 域 融合 的 最 常见 方法 。 加 权 平 均 方法 将 源 图 像 对 应 像素 的 灰 度 值 
进行 加 权 平 均 ,生成 新 的 图 像 , 它 是 最 直接 的 融合 方法 。 其 中 平均 方法 是 加 权 平 均 的 特例 ,使 用 
平均 方法 进行 图 像 融 合 , 提 高 了 融合 图 像 的 信 品 比 ,但 削弱 了 图 像 的 对 比 度 ,尤其 对 于 只 出 现在 
其 中 一 幅 图 像 上 的 有 用 信号 。 设 参加 融合 的 两 个 源 图 像 分 别 为 4 了 ,大 小 为 M x N, 经 过 融合 后 
得 到 的 图 像 为 Fo 那么 ,对 A、B 两 个 源 图 像 的 灰 度 值 加 权 平 均 融 合 方法 可 以 表示 为 : 

F(i j) =w,4A(i, j) *eB(i,j) (10-5) 

加 权 平 均 法 的 优点 是 简单 直观 ,适合 实时 处 理 , 通 过 这 种 融合 可 以 提高 融合 目标 检测 的 可 
靠 性 。 但 是 ,简单 的 像素 值 苹 加 融合 图 像 往往 难以 满足 要 求 ,特别 是 当 融 合 图 像 的 灰 度 值 差 异 
很 大 时 ,就 会 出 现 明显 的 拼接 痕迹 ,不 利于 人 眼 识别 和 后 续 的 目标 识别 过 程 。 

(2) 基 于 HVS 的 融合 方法 

由 于 人 眼 通 常 对 中 等 灰 度 等 级 最 为 敏感 ,向 低 灰 度 和 高 灰 度 两 个 方向 呈 非 线性 下 降 ; 对 图 
像 平滑 区 域 的 噪声 敏感 ,而 对 纹理 区 域 的 噪声 不 敏感 ;对 边缘 信息 敏感 。 基 于 HVS 的 融合 方 
法 根据 人 眼 视 觉 特性 对 灰 度 具有 的 敏感 性 ,HVS 融合 图 像 保 持 了 边缘 信息 和 目标 的 光谱 特 
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点 ,适用 于 相关 性 较 弱 、 互 补 性 明显 的 多 光谱 图 像 的 融合 ,但 融合 图 像 中 包含 噪声 。 

2. 基于 变换 域 的 图 像 融 合 方法 

基于 变换 域 图 像 融合 算法 的 基本 思想 是 首先 将 源 图 像 进行 图 像 变 换 ( 如 DCT 变换、 小 波 
变换 ) 得 到 各 图 像 分 解 后 的 系数 表示 , 按 一 定 的 融合 规则 处 理 这 组 系数 从 而 得 到 一 组 新 的 系 
数 表示 ,最 后 将 新 的 系数 表示 经 过 反 变 换 得 到 融合 图 像 。 在 这 一 节 ,着 重 介 绍 基于 小 波 变换 的 
图 像 融合 方法 。 

基于 小 波 变换 的 图 像 融合 是 将 原始 图 像 进 行 小 波 分 解 ,得 到 一 系列 不 同 频段 的 子 图 像 ,这 
些 子 图 像 能 够 反映 图 像 的 局 部 特征 ,然后 用 不 同 的 融合 规则 对 子 图 像 进行 处 理 ,最 后 利用 小 波 
逆 变 换 得 到 融合 图 像 , 如 图 10-11 中 所 示 。 








融合 后 的 
A 小 波 变换 系数 融合 规则 Do 
图 10-11 ”基于 小 波 变换 的 图 像 融合 算法 流程 
基于 小 波 变换 的 图 像 融 合 基本 步骤 如 下 : 
a. 对 原始 图 像 进行 预 处 理 和 图 像 配 准 ; 
b. 对 处 理 过 的 图 像 分 别 进行 小 波 分 解 , 得 到 低频 和 高 频 分 量 ; 
c. 对 低频 和 高 频 分 量 采 用 不 同 的 融合 规则 进行 融合 ; 
d. 进行 小 波 闭 变 换 ; 
e. 得 到 融合 图 像 。 
可 以 把 图 像 融合 的 整个 过 程 按 如 下 的 模型 来 描述 : 
RsW'[F(WI1I)] (10-6) 
式 中 ,到 KIRE K IENS; W RU NICE ET: LE 表示 融合 算 子 ;WW 表示 小 波 变换 逆 算 
子 ;R 表示 最 后 得 到 的 融合 图 像 。 在 小 波 变换 算 子 部 分 , Matlab 工具 箱 提供 了 几 种 常用 的 如 
Harr 小 波 、Mexican 草帽 小 波 、Morlet 小 波 等 ,这 里 对 这 几 种 小 波 做 简单 介绍 。 
Harr 小 波 :Harr 函数 是 由 数学 家 A. Harr 在 1909 年 提出 的 , 它 满足 正 交 性 和 紧 支 撑 性 ,是 
所 有 已 知 小 波 中 最 简单 的 小 波 基 。 定 义 为 : 
l, Ox 
b(t) 24-1, l/2xt«l (10-7) 
0, else 
Mexican 草帽 小 波 :也 称 Marr 小 波 ,是 Gauss 函数 的 二 阶 导 数 。 定 义 为 ; 
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b(t) = (1 -8)e75 (10-8) 
$(1) = mee (10-9) 
Mexican 草帽 小 波 在 时 域 和 频 域 都 具有 很 好 的 局 部 化 特性 。 该 小 波 在 计算 机 视觉 领域 具 
有 很 重要 的 作用 ,适用 于 图 像 边缘 提取 视觉 分 析 和 基因 检测 等 领域 。 
Morlet 小 波 ; Morlet 小 波 是 最 常用 的 复 值 小 波 。 定 义 如 下 ， 
所 (10-10) 
C 是 重 构 时 的 归 一 化 常数 。 由 于 该 小 波 的 时 域 和 频 域 局 部 性 能 较 好 ,因此 是 一 种 比较 有 用 
的 小 波 。 
10.3.4 ”图像 融 合算 法 结果 分 析 
为 了 更 直观 体现 不 同 算法 的 融合 效果 , 原始 图 像 分 别 采 用 左右 聚焦 的 两 幅 图 像 , 如 
图 10-12 中 a) b) 所 示 , 图 10-12c) 和 d) 则 分 别 表示 采用 加 权 平 均 和 小 波 变 换 得 到 的 融合 图 像 
(实验 中 使 用 的 是 Harr 小 波 ) 。 观 察 这 两 幅 图 像 可 以 发 现 ,这 两 种 算法 的 图 像 细 节 重 构 都 比较 
好 ,图 像 整体 上 比较 清晰 。 从 图 像 细 节 重 构 的 效果 上 来 看 ,基于 小 波 变换 的 图 像 融 合 方法 所 得 
的 图 像 边缘 更 加 突出 ,效果 更 好 。 





a) 聚焦 右 侧 的 图 像 b) 育 焦 左 侧 的 图 像 





c) 加 权 均 值 融合 结果 d) 小 波 变换 融合 结果 
图 10-12 图像 融合 效果 对 比 


附 部 分 Matlab 程序 清单 如 下 。 
a. 加 权 均 值 融 合 : 
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cle; 
clear all; 
I origin = im2double( imread( '1. bmp) ) ; 
I origin2 = im2double( imread( '2. bmp') ) ; 
wl 20.5,w2 20.5; % 定 义 权 值 
I result 2 wl * I origin + w2 * I. origin2; 
imwrite( I, result, 'f. jpg") ; 
subplot(2,2,3) ; 
imshow( I. result) ; 
title([' MARZ ']); 
b. 小 波 变换 图 像 融 合 : 
clc; 
clear all; 
clear 
I origin = imread( 1. bmp') ; 
I1 = double( I origin) / 256; 
I origin = imread( 2. bmp') ; 
I2 = double(I origin2 ) / 256; 
lever = 2; % 分 解 层 数 
type = ‘haar';% 小 波 类 型 
[Il_w,s0] = wavedec2(Il, lever, type) ;% 小 波 分 解 
[I2_w,sl] = wavedec2( I2, lever, type); 
length = size(I2 w); 
Coef Fusion = zeros(1,length(2)) ; 
Coef Fusion(1:51(1,1)) = (Il. w(1:sl(1,1)) 4 I2. w(1:s1(1,1)))72; % 小 波 变换 
低频 系数 处 理 , 求 均值 
MM1 = Il, w(sl(1,1) +1;length(2)); % 小 波 变换 高 频 系数 处 理 , 取 绝 对 值 较 大 的 
MM2 = D w(sl(1,1) *1:length(2)) ; 
mm = (abs(MM1)) > (abs( MM2)); 
Y = (mm. *MMI) + (( ~mm). * MM2); 
Coef Fusion(s1(1,1) -1:length(2)) = Y; 
Y = waverec2(Coef Fusion,sO0,type) ; 96 T 
subplot(2,2,1) ; 
imshow(I1) ; % 输 出 图 像 
colormap( gray ) ; 
title ( 'input2') ; 
subplot(2,2,2) ; 
imshow( I2 ) ; 
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colormap( gray ) ; 

title( 'input2') ; 

% axis square 

subplot(223) ;imshow( Y,| |); 
colormap( gray ) ; 


title(! 融合 图 像 ') ; 
10.4 运动 目标 检测 


运动 目标 检测 是 指 从 序列 图 像 中 将 变化 区 域 ( 目标 ) 从 背景 中 分 割 出 来 的 技术 方法 ,是 目 
标识 别 与 跟踪 .运动 图 像 编 码 .安全 监控 等 视频 分 析 和 处 理 等 应 用 的 关键 步骤 。 检 测 的 质量 直 
接 关系 到 后 续 处 理 的 效果 。 完 整 .迅速 ,准确 的 提取 出 运动 目标 ,能 有 效 提高 后 续 的 目标 跟踪 
和 行为 理解 的 精度 。 运 动 目标 检测 在 智能 监控 、 视 频 压 缩 .自动 导航 \ 人 机 交互 .虚拟 现实 等 许 
多 领域 中 有 广泛 的 应 用 前 景 。 

在 实际 中 ,视频 分 帧 图 像 的 背景 常常 受到 光照 .阴影 .天气 的 影响 ,使 得 检测 运动 目标 的 困 
难 加 大 。 一 个 好 的 运动 目标 检测 算法 通常 要 具有 以 下 特征 : 

a. 对 目标 所 在 的 环境 中 的 缓慢 变化 如 光照 .阴影 .天气 变化 等 不 敏感 ; 

b. 能 较 好 的 排除 运动 目标 所 在 运动 场景 中 的 某 些 干扰 (如 摇摆 的 树枝 、 湖 面 上 的 水 纹 波 
动 ) ; 

c. 在 复杂 的 运动 背景 中 能 检测 并 提取 出 运动 目标 ,而 且 对 复杂 目标 同样 生效 ; 

d. 在 检测 目标 的 的 过 程 中 排除 物体 阴影 的 干扰 ; 

e. 检测 出 的 结果 具有 较 高 的 精度 。 

10.4.1 常见 运动 目标 检测 算法 概述 

目前 ,运动 目标 检测 算法 通常 大 致 可 分 为 两 类 :一 类 是 静态 背景 下 的 目标 检测 , 即 图 像 背 
景 相对 摄像 机 静止 ; 男 一 类 是 动态 背景 下 的 目标 检测 , 即 图 像 背 景 与 摄像 机 存在 着 相对 运动 。 
其 中 ,静态 背景 下 的 目标 检测 比较 容易 ,通常 运用 帧 间 差分 法 或 背景 减 除法 即 可 获得 运动 目标 
的 信息 。 动 态 背 景 下 的 目标 检测 则 相对 比较 复杂 ,因为 它 包含 了 两 种 运动 :目标 的 运动 和 摄像 
机 运动 造成 的 全 局 图 像 运动 。 动 态 背 景 下 的 目标 检测 方法 研究 更 具有 挑战 性 和 实际 意义 , 光 
流 法 以 及 全 局 运动 补偿 是 动态 背景 下 目标 检测 的 主要 手段 。 

1. 帧 间 差 分 法 

帧 间 差 分 法 是 在 运动 目标 检测 中 最 常用 的 方法 , 当 背 景 静止 时 能 够 取得 较 好 的 检测 结果 。 
由 于 差分 往往 是 在 相 邻 两 帧 或 三 帧 间 进 行 的 ,因此 称 为 帧 间 差 分 法 。 其 基本 思想 是 在 视频 序 
列 中 的 相 邻 两 帧 或 者 三 帧 间 利用 他 们 之 间 的 目标 运动 的 差异 差分 计算 ,并 对 其 差分 结果 羡 值 
化 提取 出 目标 所 在 图 像 上 的 运动 区 域 ,图 像 帧 相 减 可 以 去 掉 灰 度 没有 发 生变 化 的 部 分 。 该 方 
法 的 最 大 特点 就 是 速度 快 ,背景 不 积累 更 新 速度 快 ,而 且 对 整体 光照 变化 不 是 很 敏感 , 比 光 流 
法 计算 量 小 ,程序 设计 相对 简单 ,容易 实时 监控 。 不 足 之 处 是 对 环境 噪声 较 敏 感 ,但 既 要 抑制 
住 图 像 噪声 又 要 留 住 图 像 中 的 有 用 变化 就 增加 了 靖 值 选取 的 难度 。 当 遇 到 颜色 相近 、 较 大 的 

— 461 — 


图 像 处 理 与 机 器 视觉 


运动 目标 时 很 可 能 在 目标 内 部 产生 空洞 现象 以 致 不 能 完整 的 提取 出 运动 目标 。 帧 间 差 分 法 的 
原理 图 如 图 10-13 中 所 示 。 


第 二 1 帧 图 像 





图 10-13” 帧 间 差 分 法 原理 图 


帧 间 差分 法 的 表达 式 为 ， 
D,(x,y) 2 My) -1 1(x,y) | (10-11) 
B,(x,y) Ko di (10-12) 
is 0,D, (x,y) ST 


其 中 ,L(x,y) 和 7_,(x,y) 分 别 表示 像素 点 (x,y) 处 第 t 帧 和 第 1-1 MENR; D, (x,y) EIR 
相 邻 两 帧 图 像 差分 后 的 图 像 ;B, (x,y) 表示 经 过 闭 值 判 断后 ,差分 图 像 的 二 值 化 图 像 ;7 为 
国 值 。 

由 于 帧 间 差 法 反映 的 运动 目标 运动 状态 的 像素 点 偏 少 ,而 且 连 续 两 帧 图 像 的 帧 间 差 检测 
出 的 运动 目标 有 时 会 比 实际 的 运动 目标 大 很 多 ,为 了 改进 帧 间 差 法 的 效果 ,有 文献 提出 了 利用 
三 帧 图 像 检测 运动 目标 的 思想 。 设 视频 图 像 序 列 中 相 邻 三 帧 图 像 分 别 为 了 (xy) Le y) 
LA (x,y) ,7 为 冰 值 , 则 此 时 的 帧 间 差 分 法 的 表达 式 为 ， 

D,(x,y) = La (2,7) -21,(%,y) +1, (2,7) | (10-13) 
1,D(x,y)»T 
UAE aai (10-14) 

由 于 利用 了 三 帧 图 像 信息 ,提高 了 运动 目标 检测 的 质量 与 精度 。 但 是 因为 该 算法 涉及 相 
邻 的 三 帧 图 像 ,所 以 会 产生 一 帧 的 时 间 停 滞 。 在 视频 图 像 满 足 帧 间隔 时 ,一 帧 的 时 间 停 滞 一 般 
不 会 对 实时 运动 目标 检测 产生 较 大 的 影响 。 

此 外 , 国 值 的 选取 对 目标 检测 精度 有 很 大 的 影响 ,常量 定 值 的 国 值 往往 只 能 适用 于 特定 的 
场合 ,为 了 提高 运动 检测 的 鲁 棒 性 ,可 以 采用 一 种 自 适 应 的 阐 值 选择 方法 。 由 于 运动 区 域内 像 
素 的 灰 度 变化 要 大 于 整个 图 像 灰 度 变 化 的 平均 值 ,因而 通常 可 以 选取 差分 图 像 的 均值 作为 阔 
值 。 假 设 d(x,y) 为 差分 图 像 中 点 (x,y) 处 的 灰 度 值 ,N 和 M 分 别 表示 图 像 的 宽度 和 高 度 , 则 
差分 图 像 的 均值 aver 为 : 


Ed(x,9) (10-15) 

背景 减 除法 是 将 当前 图 像 和 固定 背景 图 像 进 行 “ 相 减 "运算 ,通过 比较 两 幅 图 像 的 差异 情 
况 , 可 以 获取 一 个 运动 物体 在 此 背景 下 运动 的 信息 。 背 景 图 像 是 指 一 幅 没 有 运动 目标 的 图 像 ， 
E on 
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“ 相 减 "所 得 区 域 即 为 需要 检测 的 运动 目标 的 区 域 。 背 景 减 除法 与 帧 间 差 分 法 有 相似 的 地 方 ， 
可 以 说 背景 差分 法 是 一 种 将 帧 间 差 分 改 为 当前 帧 与 背景 帧 进行 差分 的 特殊 的 帧 间 差 分 法 。 
背景 差分 的 基本 原理 如 图 10-14 所 示 。 





图 10-14 背景 差分 法 原理 图 


WE 1(%,y) 为 背景 图 像 中 某 一 像素 点 ,1,(x,y) 是 含有 目标 的 图 像 中 的 某 一 像素 点 , 则 背景 
减 除法 如 下 所 示 : 


D,(x,y) = |1(x,y) -L(x,y) | (10-16) 
I,D,.(v,y) »T 
Biss) e dE (10-17) 

显然 背景 减 除法 的 重点 是 能 够 在 理想 情况 下 获取 一 幅 “ 纯 净 " 的 图 像 做 背景 ,但 是 实际 中 
获得 一 幅 “ 纯 净 " 的 没有 任何 目标 出 现 的 背景 图 像 是 极其 困难 时 ,背景 的 轻微 扰动 及 外 界 光 线 
的 变化 都 会 增加 背景 获取 的 难度 ,按照 获取 图 像 背景 以 及 更 新 算法 的 差异 ,可 以 分 为 统计 方 
法 、 自 适应 背景 更 新 算法 .背景 法 等 。 其 中 统计 平均 方法 是 实际 中 较 常 用 的 自 适应 背景 修正 的 
方法 ,对 多 幅 背 景 图 像 取 平均 ,在 场景 内 目标 停留 的 时 间 较 短 且 不 频繁 时 可 以 取得 很 好 的 效 
果 。 其 背景 修正 方法 公式 如 下 : 

Kay) UL, a Gy) + Las] (10-18) 

3. JE sui 

光 流 的 概念 是 Gibso TE 1950 年 首次 提出 的 , 指 的 是 时 间 变 化 过 程 中 图 像 亮度 模式 的 变化 
速度 ,是 利用 图 像 序列 中 像素 在 时 间 域 上 的 变化 以 及 相 邻 帧 之 间 的 相关 性 来 找到 上 一 帧 跟 当 
前 帧 之 间 存 在 的 对 应 关系 ,从 而 计算 出 相 邻 帧 之 间 物 体 的 运动 信息 的 一 种 方法 。 

光 流 法 作为 一 种 目标 检测 方法 ,基本 思想 是 把 亮度 恒定 作为 约束 假设 或 以 灰 度 梯度 基本 
不 变 为 基础 ,该 方法 首次 是 被 学 者 Horn 和 Schunck 在 20 世纪 80 年 代 初 提出 的 ,所 谓 的 光 流 
法 就 是 将 目标 在 连续 的 两 帧 图 片上 的 前 后 移动 对 应 的 像素 用 向 量 来 表示 ,增加 速度 矢量 给 图 
形 中 的 每 一 个 像素 点 ,建立 图 像 运 动 场 ,由 投影 关系 得 到 某 一 时 刻 图 像 像素 点 与 三 维 目 标 上 的 
点 的 对 应 关系 ,通过 分 析 像 素 点 的 速度 矢量 ,获取 运动 目标 区 域 。 当 图 像 运动 场 中 没有 运动 目 
标 时 , 则 光 流 矢量 变化 平滑 ; 当 运 动 目标 在 图 像 运动 场 中 发 生 相 对 运动 时 , 则 运动 目标 的 速度 
矢量 一 定 不 同 于 相 邻 背 景区 域 的 速度 矢量 ,从 而 将 运动 目标 从 图 像 中 分 离 出 来 。 光 流 不 等 同 
于 运动 场 ,有 光 流 不 一 定 有 目标 和 运动 产生 ,目标 运动 也 不 一 定 会 产生 光 流 。 但 一 般 情况 下 ,可 
以 忽略 表 观 运动 和 物体 真实 运动 之 间 的 差异 ,用 光 流 场 来 代替 运动 场 ,分 析 图 像 中 的 运动 目标 
及 其 运动 参数 。 其 流程 如 图 10-15 所 示 。 
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图 10-15 ”交流 法 流程 图 

光 流 法 大 致 可 分 为 全 局 光 流 法 和 局 部 光 流 法 。 全 局 是 对 整 幅 图 像 来 讲 的 ,而 局 部 指 的 是 
图 像 的 部 分 区 域 。 局 部 光 流 法 能 很 好 的 反映 出 运动 目标 边缘 上 的 光 流 信息 ,缺点 是 对 其 中 的 
噪声 较 敏 感 ,其 光 流 方程 在 灰 度 平坦 的 区 域 上 无 解 。 相 比 下 ,全 局 光 流 法 更 稳定 ,但 是 它 只 能 
求 得 整 幅 图 像 移动 产生 的 光 流 , 相 对 运动 区 域 的 光 流 方程 无 解 。 全 局 光 流 场 运动 参数 在 有 噪 
Ps .数据 稀 朴 、 光 流 数据 不 准确 的 环境 中 需要 进一步 研究 。 因 此 很 多 研究 人 员 慢 慢 开 始 对 局 部 
光 流 场 展 开 研究 。 具 体 求解 过 程 如 下 : 

假设 像素 点 n 在 (x,y) 处 tt 时刻 的 灰 度 为 E(x,y,t) E(x € V,dt,y & V,dt,t e dt) 为 点 (x， 
y) fE t di 时刻 运 动 到 (x + Vde, y + Vde) 的 灰 度 ,运动 前 后 为 同一 点 , 故 得 到 光 流 约 东 方 
FEN: 


E(x,y,t) 2 E(x +V,dt,y +V,dt,t + dt) (10-19) 
TE XX (10-19) 的 右边 泰勒 级 数 展开 , 令 di 一 0 有 : 
E(x,y,t) 2 E(x,y,t) «Ey. +% told) (10-20) 
其 中 ,o( de ) 代 表 阶 数 大 于 2 的 项 。 
设 : 
a ðE ðE 
nep e Ta (10-21) 
化 简 式 (10-21) a 与 速度 分 量 直接 的 关系 : 
EV « E,V, * E, Z0 (10-22) 
或 
VE: VV, «E,-0 (10-23) 


EP ,y E = [E,,E,] 是 图 像 像 素 点 处 的 梯度 ,VE. V V, 是 向 量 的 点 积 , 这 个 方程 就 是 光 
流 约束 方程 。 

实际 上 ,上 述 光 流 约束 方程 产生 的 是 恒 值 亮度 轮廓 图 像 运 动 的 法 向 分 量 V, =sn 其 中 s 和 
n 分别 是 法 向 运动 分 量 的 大 小 和 方向 : 


- E, 
$—————— 

VE 

LET (10-24) 
nae NET. 

IVE || 


显然 ,由 式 (10-24 ) 不 能 唯一 确定 光 流 ,必须 加 入 其 他 约束 条 件 来 同时 求解 V,、V,。 例 如 ， 
使 用 光 流 的 全 局 平滑 性 假设 来 求解 光 流 的 Hom-Schunck 方法 ,用 一 个 模型 通过 最 小 二 乘法 来 
拟 合 像素 点 邻 域内 的 光 流 值 约束 光 流 进行 局 部 调整 的 Lucas-Kanade 方法 ,利用 二 阶 导数 求 光 
流 Nagel 方法 等 。 光 流 法 的 优点 是 在 摄像 机 相对 运动 的 前 提 下 也 能 检测 出 独立 的 运动 目标 ， 
但 计算 方法 相当 复杂 ,实时 性 不 高 , 抗 干扰 能 力 较 差 。 
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1. 实验 步骤 

以 帧 间 差 分 法 为 例 ,运动 目标 检测 算法 的 流程 大 致 如 下 : 

(1) 如 图 10-16 ,图 a) b) 选 取 了 一 段 视屏 的 第 79 帧 和 第 80 帧 的 图 像 ,按照 帧 间 差 分 法 的 
计算 式 (10-11) 和 式 (10-12) 对 图 像 “ 作 差 " ,如 图 10-16c) 所 示 ， 

(2) 对 图 10-16c) 进 行 二 值 化 处 理 , 效 果 如 图 10-16d) 中 所 示 

(3) 对 图 10-16d) 进 行 形态 学 处 理 , 此 处 用 闭 运算 来 填补 二 值 化 后 图 像 内 部 的 “空洞 ”。 

(4) 对 图 10-16d) 进 行 连通 性 分 析 , 找 出 最 大 联通 区 域 并 圈定 . 








图 10-16 ” 帧 间 差 分 法 实验 结果 
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2. 帧 间 差 分 法 Matlab 程序 清单 
clear 
clc 
wuc = imread( 79. jpg) ; 9o 读 取 第 79 帧 图 片 
wu = rgb2gray ( wuc ) ; 
youc = imread( '80. jpg ) ; % 读 取 第 80 帧 图 片 
you = rgb2gray( youc ) ; 
wu = double( wu )/255 ; 
you = double( you) /255 ; 
d(:,:) 2abs(you(:,:)-wu(:,:)):; % 求 差 值 
bwl = im2bw(d,0.2) ; % 二 值 化 处 理 
se90 = strel ( 'line',3,90) ; 
se0 = strel (line' ,3 ,0) ; % 对 上 述 图 像 进行 形态 学 处 理 
bw = imdilate( bw, [ se90 ,se0] ) ;bw = bwmorph (bw, 'close') ; 
bw = bwareaopen( bw,10); 
[bwl,In] 2bwlabel(bw,4) ; % 寻 找 最 大 联通 区 域 
bwl_index 20; 
bwl_big =0; 
for m =1:ln 

tmp = sum( sum(bwl = 2m)); 

if( tmp > bwl. big) 

bwl big = tmp; 
bwl index 2m; 

end 
end 
obj = (bwl = -2bwl index); % 取 最 大 联通 区 域 
[e,r] =find(obj = =1); % 统 计 位 置 坐标 
xbegin 2 min(r) ; 
ybegin = min(c) ; 
xlength = max ( r) -xbegin ; 
ylength = max ( c) -ybegin; 
iml = wuc; im2 = youc ; 
im3 2 imadjust(d,[0,0.2],[0,1]); % 对 比 度 增强 后 显示 (便于 看 到 两 幅 图 像 的 差 值 ) 
im4 = bwl; im5 = bw; 
subplot(231 ) ;imshow(iml ) ;title(' 原 图 ') ;imwrite(iml ,' 原 图 . jpg) ; 
subplot(232) ;imshow(im2) ;title(' 目标 ) ;imwrite(im2 目标 . jpg) ; 
subplot(233 ) ;imshow(im3 ) ;title(' Él Fr 35 ') ;imwrite(im3 ， 图 片 差 .jpg ) ; 
subplot(234) ; imshow ( im4 ) ;title(' 二 值 化 ') ;imwrite(im4,' 二 值 化 后 . jpg') ; 
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subplot (235 ) ;imshow( im5 ) ;title( ' 形态 学 处 理 ') ; imwrite(im5 ， 形态 学 处 理 . jpg) ; 
subplot ( 232 ) ; 96 LE HER 
hold on 
plot( xbegin + xlength/2 , ybegin + ylength/2 ,' +!) ; 
rectangle ( ' Position , [ xbegin , ybegin , xlength , ylength ] , 'EdgeColor' ,'g') ; 
hold off 
3. 结果 分 析 ( 图 10-16) 
分 析 实 验 结果 可 以 发 现 , 帧 间 差 分 法 的 算法 复杂 度 最 低 ,实时 性 也 最 高 ,在 静态 背景 
条 件 下 能 偶 取 得 不 错 的 检测 结果 ,但 检测 得 到 的 运动 目标 区 域 会 产生 空洞 并 且 大 于 实际 
运动 区 域 。 


10.5 目标 跟踪 


运动 目标 跟踪 算法 是 数字 图 像 处 理 与 机 器 视觉 领域 研究 的 重要 课题 ,其 主要 目的 是 通过 
对 图 像 序 列 中 的 目标 进行 检测 提取、 识别 和 跟踪 ,计算 出 运动 目标 在 每 一 帧 图 像 上 的 二 维 坐 
标 位 置 , 将 图 像 序列 中 连续 帧 间 的 同一 运动 目标 关联 起 来 ,得 到 每 帧 图 像 中 目标 的 运动 参数 以 
及 相 邻 帧 图 像 间 运动 目标 的 对 应 关系 。 从 而 获得 目标 实际 的 运动 方向 位置. 速度 等 信息 , 简 
单 地 说 ,就 是 在 下 一 帧 图 像 中 找到 目标 的 确切 位 置 和 加 速度 等 信息 ,并 反馈 给 跟踪 系统 进行 跟 
踪 ,为 目标 做 进一步 的 分 析 与 理解 提供 帮助 。 随 着 计算 机 技术 的 不 断 发 展 , 计 算 能 力 得 到 了 极 
大 提高 ,廉价 高 性 能 摄像 头 的 广泛 应 用 以 及 自动 视频 分 析 需 求 的 不 断 增 长 ,基于 视觉 的 目标 跟 
踪 算 法 研究 成 为 计算 机 视觉 中 的 研究 热点 。 

目标 跟踪 在 民用 和 军用 领域 具有 极其 重要 的 应 用 价值 。 在 民用 领域 ,最 常见 的 是 对 机 场 、 
广场 轨道 交通 、 别 墅 区 、 政 府 行政 单位 、 军 区 博物 馆 等 各 类 型 场所 的 治安 智能 监控 。 在 军用 
领域 ,战斗 机 等 飞行 器 对 空中 或 地 面目 标 进 行 跟踪 和 识别 ,在 现代 战争 中 具有 重要 意义 ,是 实 
施 精准 打击 的 必要 手段 。 目 标 跟踪 技术 发 展 到 今天 已 经 取得 了 极 大 的 进步 ,但 同时 由 于 视频 
采集 过 程 中 容易 受到 环境 的 影响 ,例如 光照 变化 、 局 部 遮挡 、 目 标尺 度 变化 等 ,使 得 要 检测 的 目 
标 发 生 形状 上 的 变化 ,同样 类 型 的 目标 物体 形状 可 能 会 有 很 大 差异 ,不 同类 型 的 目标 物体 的 形 
状 差异 可 能 较 小 ,这 也 给 运动 目标 检测 和 识别 带 来 了 很 大 的 挑战 。 

10.5.1 常见 目标 跟踪 算法 概述 

在 前 一 节 已 经 介绍 了 常见 的 运动 目标 识别 方法 ,目标 识别 是 目标 跟踪 的 基础 ,目前 主流 的 
目标 跟踪 方法 ,根据 对 被 跟踪 目标 信息 使 用 情况 的 不 同 ,可 将 算法 分 为 :基于 对 比 度 分 析 的 目 
标 跟踪 、 基 于 匹配 的 目标 跟踪 、 核 方法 和 基于 运动 检测 的 目标 跟踪 。 基 于 对 比 度 分 析 的 跟踪 算 
法 主要 利用 目标 和 背景 的 对 比 度 差异 ,实现 目标 的 检测 和 跟踪 。 基 于 匹配 的 跟踪 主要 通过 前 
后 帧 之 间 的 特征 匹配 实现 目标 的 定位 。 基 于 运动 检测 的 跟踪 主要 根据 目标 运动 和 背景 运动 之 
间 的 差异 实现 目标 的 检测 和 跟踪 。 前 两 类 方法 都 是 对 单 帧 图 像 进行 处 理 ,基于 匹配 的 跟踪 方 
法 需要 在 帧 与 帧 之 间 传 递 目标 信息 ,对比 度 跟 踪 不 需要 在 帧 与 帧 之 间 传 递 目标 信息 。 基 于 运 
动 检测 的 跟踪 需要 对 多 帧 图 像 进行 处 理 , 如 图 10-17 所 示 。 
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图 10-17 主流 目标 跟踪 算法 


1. 基于 对 比 度 分 析 的 跟踪 方法 

对 比 度 跟踪 是 利用 目标 与 背景 之 间 的 对 比 度 来 识别 和 提取 目标 信号 ,从 而 实现 自动 跟踪 
目标 的 一 种 方法 。 图 像 跟踪 的 对 比 度 跟 踪 方 法 中 依 跟踪 参考 点 的 不 同 可 分 为 :边缘 跟踪 、 形 心 
跟踪 质心 跟踪 等 。 边 缘 跟踪 的 优点 是 计算 简单 .响应 快 ,在 某 些 场合 (如 要 求 跟踪 目标 的 左 
上 角 或 右 下 角 等 ) 有 其 独到 之 处 。 缺 点 是 跟踪 点 易 受 干扰 ,跟踪 随机 误差 大 。 重 心 跟 踪 算 法 计 
算 简便 ,精度 较 高 ,但 容易 受到 目标 的 剧烈 运动 或 目标 被 遮挡 的 影响 。 重 心 的 计算 不 需要 清楚 
的 轮廓 ,在 均匀 背景 下 可 以 对 整个 跟踪 窗口 进行 计算 ,不 影响 测量 精度 。 重 心 跟踪 特别 适合 背 
景 均 匀 对比度 小 的 弱小 目标 跟踪 等 一 些 特殊 场合 。 形 心 跟踪 和 重心 跟踪 方法 相近 ,图 像 二 值 
化 之 后 , 按 重心 公式 计算 出 的 是 目标 图 像 的 形 心 。 

对 比 度 跟踪 方法 可 以 跟踪 快速 运动 的 目标 ,对 目标 姿势 变化 的 适应 性 强 , 但 识别 目标 的 能 
HÆ ,难以 跟踪 复杂 背景 中 的 目标 。 所 以 对 比 度 跟 踪 法 基本 上 只 适用 于 跟踪 空中 或 水 面目 标 。 

2. 基 于 匹配 的 跟踪 算法 

图 像 相 关 匹 配 是 一 种 基于 最 优 相关 理论 的 图 像 处 理 方法 ,主要 用 于 目标 识别 、 检 测 以 及 跟 
踪 。 在 相关 匹配 过 程 中 ,存在 一 个 表示 目标 或 待 检测 物体 的 模板 ,通过 计算 模板 与 待 分 析 对 象 
的 相似 程度 ,从 而 识别 出 或 检测 到 相应 的 目标 ,进而 在 跟踪 过 程 中 ,分 析 得 到 当前 图 像 中 的 具 
体位 置 。 

(1) 特征 匹配 

特征 是 目标 可 区 别 其 他 事物 的 属性 , 如 可 区 分 性 .可靠 性 .独立 性 和 稀 玻 性 。 基 于 匹配 的 
目标 跟踪 算法 需要 提取 目标 的 特征 ,并 在 每 一 帧 中 寻找 该 特征 。 寻 找 的 过 程 就 是 特征 匹配 

特征 提取 是 一 种 变换 或 者 编码 ,将 数据 从 高 维 的 原始 特征 空间 通过 映射 变换 到 低 维 空间 
的 表示 。 根据 Marr 的 特征 分 析 理 论 , 有 4 种 典型 的 特征 计算 理论 :神经 还 原 论 、 结 构 分 解 理 
论 ,特征 空间 论 和 特征 空间 的 近似 。 神经 还 原 论 直接 源 于 神经 学 和 解剖 学 的 特征 计算 理论 , 它 
与 生物 视觉 的 特征 提取 过 程 最 接近 ,其 主要 技术 是 Gabor 滤波 器 小波 滤波 器 等 。 结 构 分 解 理 
论 是 到 目前 为 止 唯一 能 够 为 新 样本 进行 增 量 学 习 提 供 原则 的 计算 理论 ,目前 从 事 该 理论 研究 
的 有 麻 省 理工 学 院 实验 组 的 视觉 机 器 项 目 组 等 。 特 征 空间 论 主要 采用 主 分 量 分 析 (PCA ) th 
立 分 量 分 析 (ICA) FAREA (SCA) 和 非 负 和 矩阵 分 解 (NMF ) 等 技术 抽取 目标 的 子 空间 特 
征 。 特征 空间 的 近似 属于 非 线 性 方法 ,适合 于 解决 高 维 空间 上 复杂 的 分 类 问题 ,主要 采用 流 
形 、 李 代数 微分 几何 等 技术 。 
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目标 跟踪 中 用 到 的 特征 主要 有 几何 形状 、 子 空间 特征 、 外 形 轮廓 和 特征 点 等 。 其 中 ,特征 点 
是 匹配 算法 中 常用 的 特征 。 特征 点 的 提取 算法 很 多 , 如 Kanade Lucas Tomasi ( KLT) 算 法 、Harris 
算法 SIFT 算法 以 及 SURF 算法 等 。 特 征 点 一 般 是 稀 踢 的 ,携带 的 信息 较 少 ,可 以 通过 集成 前 几 
帧 的 信息 进行 补偿 。 目 标 在 运动 过 程 中 ,其 特征 (如 姿态 .几何 形状 、 灰 度 或 颜色 分 布 等 ) 也 随 之 
变化 。 目 标 特征 的 变化 具有 随机 性 ,这 种 随机 变化 可 以 采用 统计 数学 的 方法 来 描述 。 直 方 图 是 
图 像 处 理 中 天 然 的 统计 量 ,因此 彩色 和 边缘 方向 直方 图 在 跟踪 算法 中 被 广泛 使 用 。 

(2) 贝 叶 斯 跟踪 

目标 的 运动 往往 是 随机 的 ,这 样 的 运动 过 程 可 以 采用 随机 过 程 来 描述 。 很 多 跟踪 算法 往 
往 建立 在 随机 过 程 的 基础 之 上 ,如 随机 游 走 过 程 、 马 尔 科 夫 过 程 、 自 回归 ( AR ) 过 程 等 。 随机 过 
程 的 处 理 在 信号 分 析 领 域 较 成 熟 ,其 理论 和 技术 (如 贝 叶 斯 滤波 ) 可 以 借鉴 到 目标 跟踪 中 。 贝 
叶 斯 滤波 中 ,最 有 名 的 是 Kalman 滤波 (KF) 。KF 可 以 比较 准确 地 预测 平稳 运动 目标 在 下 一 时 
刻 的 位 置 , 在 弹道 目标 跟踪 中 具有 非常 成 功 的 应 用 。 一 般 而 言 ,KF 可 以 用 作 跟 踪 方 法 的 框架 ， 
用 于 估计 目标 的 位 置 ,减少 特征 匹配 中 的 区 域 搜索 范围 ,提高 跟踪 算法 的 运行 速度 。KF 只 能 
处 理 线性 高 斯 模型 ,KF 算法 的 两 种 变形 EKF 和 UKF 可 以 处 理 非 线 性 高 斯 模型 。 两 种 变形 扩 
ET KF 的 应 用 范围 ,但 是 不 能 处 理 非 高 斯 非 线 性 模型 ,这 个 时 候 就 需要 用 粒子 滤波 (PF)。 
由 于 运动 变化 ,目标 的 形变 、 非 刚体 、 缩 放 等 问题 ,定义 一 个 可 靠 的 分 布 函 数 是 非常 困难 的 ,所 
以 在 PF 中 存在 例子 退化 问题 ,于 是 引进 了 重 采 样 技术 。 事 实 上 , 贝 叶 斯 框架 下 视觉 跟踪 的 很 
多 工作 都 是 在 PF 框架 下 寻找 更 为 有 效 的 采样 方法 和 建议 概率 分 布 。 这 些 工 作 得 到 了 许多 不 
同 的 算法 ,如 马尔 可 夫 链 蒙特 卡 洛 ( MCMC ) 方 法 、Unscented #4 T UE UE 4 ( UPF ) , Rao-Black- 
wellised 粒子 滤波 器 (RBPF ) 等。 

3. 核 方法 

核 方法 的 基本 思想 是 对 相似 度 概率 密度 函数 或 者 后 验 概率 密度 函数 采用 直接 的 连续 佑 
ib. 这 样 处 理 一 方面 可 以 简化 采样 , 男 一 方面 可 以 采用 估计 的 函数 梯度 有 效 定位 采样 粒子 。 
采用 连续 概率 密度 函数 可 以 减少 高 维 状 态 空 间 引 起 的 计算 量 问题 , 还 可 以 保证 例子 接近 分 布 
模式 ,避免 粒子 退化 问题 。 核 方法 一 般 都 采用 彩色 直方 图 作为 匹配 特征 。 

Mean Shift 是 核 方 法 中 最 有 代表 性 的 算法 ,其 含义 正如 其 名 ,是 “ 偏 移 均 值 向 量 "。 直 观 上 
看 ,如 果 样 本 点 从 一 个 概率 密度 函数 中 采样 得 到 , 由 于 非 零 的 概率 密度 梯度 指向 概率 密度 增 
加 最 大 的 方向 ,从 平均 上 来 说 ,采样 区 域内 的 样本 点 更 多 的 落 在 沿 着 概率 密度 梯度 增加 的 方 
向 。 因 此 ,对 应 的 Mean Shift 向 量 应 该 指向 概率 密度 梯度 的 负 方 向 。 

Mean Shift 跟踪 算法 反复 不 断 地 把 数据 点 向 Mean Shift 矢量 方向 进行 移动 ,最 终 收敛 到 某 个 
概率 密度 函数 的 极 值 点 。 在 Mean Shift 跟踪 算法 中 ,相似 度 函 数 用 于 刻画 目标 模板 和 候选 区 域 所 
对 应 的 两 个 核 函 数 直方 图 的 相似 性 ,采用 的 是 Bhattacharyya 系数 。 因 此 ,这 种 方法 将 跟踪 问题 转 
化 为 Mean Shift 模式 匹配 问题 。 核 函数 是 Mean Shift 算法 的 核心 ,可 以 通过 尺度 空间 差 的 局 部 最 
大 化 来 选择 核 尺 度 , 若 采 用 高 斯 差分 计算 尺度 空间 差 , 则 得 到 高 斯 差分 Mean Shift 算法 。 

Mean Shift 算法 假设 特征 直方 图 足够 确定 目标 的 位 置 ,并 且 足 够 稳健 ,对 其 他 运动 不 敏 
感 。 该 方法 可 以 避免 目标 形状 .外观 或 运动 的 复杂 建 模 ,建立 相似 度 的 统计 测量 和 连续 优化 之 
间 的 联系 。 
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4. 基于 运动 检测 的 目标 跟踪 算法 

基于 运动 检测 的 目标 跟踪 算法 通过 检测 序列 图 像 中 目标 和 背景 的 不 同 运动 来 发 现 目 标 存 
在 的 区 域 ,实现 跟踪 。 这 类 算法 不 需要 帧 间 的 模式 匹配 ,不 需要 在 帧 间 传 递 目 标的 运动 参数 ， 
只 需要 突出 目标 和 非 目标 在 时 域 或 者 空域 的 区 别 即 可 。 这 类 算法 具有 检测 多 个 目标 的 能 力 ， 
可 用 于 多 目标 检测 和 跟踪 。 这 类 运动 目标 检测 方法 主要 有 帧 间 图 像 差 分 法 背景 估计 法 能量 
积累 法 .运动场 估计 法 等 。 

光 流 算法 是 基于 运动 检测 目标 跟踪 的 代表 性 算法 。 光 流 的 概念 是 Gibson 于 1950 年 首先 
提出 的 。 光 流 是 空间 运动 物体 在 成 像 面 上 的 像素 运动 的 瞬时 速度 , 光 流 矢量 是 图 像 平面 坐标 
点 上 的 灰 度 瞬时 变化 率 。 光 流 的 计算 利用 图 像 序列 中 的 像素 灰 度 分 布 的 时 域 变 化 和 相关 性 来 
确定 各 自 像素 位 置 的 运动 ,研究 图 像 灰 度 在 时 间 上 的 变化 与 景象 中 物体 结构 及 其 运动 的 关系 。 
将 二 维 速度 场 与 灰 度 相 联 系 ,引入 光 流 约束 方程 ,得 到 光 流 计算 的 基本 算法 。 光 流 不 仅 包含 了 
被 观察 物体 的 运动 信息 ,而 且 携 带 着 有 关 景 物 三 维 结构 的 丰富 信息 。 基 于 光 流 的 图 像 跟 踪 法 
主要 分 为 连续 光 流 法 和 特征 光 流 法 ,是 目标 跟踪 的 主要 方法 之 一 。 

连续 光 流 法 是 通过 提取 运动 目标 的 光 流 场 ,在 经 过 一 系列 光 流 场 区 域 处 理 , 对 相近 速度 区 
域 进 行 聚 类 , 较 完 整 的 提取 运动 目标 区 域 。 从 含 运动 目标 的 图 像 序列 中 抽取 光 流 场 ,筛选 出 光 
流 较 大 的 运动 目标 区 域 并 计算 目标 的 速度 矢量 ,从 而 实现 运动 目标 的 跟踪 。 主 要 包括 图 像 预 
处 理 ,初始 光 流 场 计算 、 光 流 场 改进 计算 、 光 流 区 域 聚 类 等 几 个 部 分 。 虽然 基于 光 流 的 方法 不 
需要 进行 连续 图 像 间 特征 的 匹配 ,但 存在 着 某 些 缺点 。 首 先 , 光 流 的 计算 需要 微分 运算 ,而 图 
像 的 微分 运算 是 对 噪声 敏感 的 ;其 次 , 光 流 的 计算 常用 松弛 和 迭代 算法 ,算法 费时 ,难以 满足 实时 
控制 的 要 求 ;连续 光 流 法 不 能 跟踪 做 较 大 速度 运动 的 目标 。 

特征 光 流 的 方法 是 通过 序列 图 像 的 特征 匹配 计算 图 像 的 特征 光 流 ,通过 光 流 聚 类 来 实现 
目标 与 背景 的 分 离 ;通过 提取 光 流 类 的 形状 信息 来 进行 目标 的 自动 识别 ;通过 目标 特征 点 的 匹 
配 来 实现 目标 的 跟踪 。 

特征 光 流 法 具有 如 下 优点 :跟踪 过 程 进行 的 是 目标 特征 点 的 匹配 ,具有 较 小 的 计算 量 , 适 
用 于 跟踪 快速 运动 的 目标 及 较 大 目标 ;利用 特征 光 流 聚 类 及 目标 形状 信息 可 实现 目标 的 正确 
分 离 与 识别 ,适用 于 多 目标 跟踪 。 主 要 有 四 个 步骤 :特征 点 检测 (对 于 刚体 运动 目标 一 般 选 取 
目标 的 角 点 )\ 特 征 光 流 估 计 、 光 流 聚 类 目标 识别。 但 由 于 算法 中 角 点 检测 和 匹配 算法 对 噪 
声 都 较为 敏感 ,所 以 ,还 是 需要 对 图 像 做 较 好 的 预 处 理 。 

10.5.2 Mean Shift 目标 跟踪 算法 

在 前 一 节 我 们 已 经 对 目前 常见 的 目标 跟踪 算法 做 了 大 致 介绍 ,本 节 以 Mean Shift 目标 跟 
踪 算 法 为 例 ,对 目标 跟踪 算法 的 流程 做 详细 阐述 。Mean shift 算法 是 基于 核 的 目标 跟踪 , 核 函 
数 对 区 间 内 的 数据 进行 加 权 处 理 的 方法 不 但 能 增强 了 表达 的 光滑 性 ,而 且 对 中 小 规模 的 数据 
集 有 很 好 的 实用 性 ,在 生成 无 偏 密度 估计 时 速度 很 快 ,概率 统计 特性 也 很 好 。Mean shift 的 基 
本 原理 如 下 。 

1. Mean Shift 算法 基本 理论 

假设 d 维 欧式 空间 R 中 , 设 有 一 个 点 的 集合 S|x;| ,i =1,2,…,n 的 Mean Shift 向 量 的 基 
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本 形式 定义 为 
M, (x) =+ X (x; 73) (1025) 


式 中 ,k 表示 此 个 样本 点 在 S, 区 域 之 中 ;$, 是 半径 为 hh 的 高 维 球 区 域 , 且 满 足以 下 关系 的 

y 点 的 集合 
S,(x) = |{y:(y -x)'(y -x) <h} (10-26) 
可 以 看 出 ,Mi,(x*) 指 向 样本 分 布 最 多 的 区 域 , 即 概率 密度 函数 的 梯度 方向 。 考 虑 采样 点 的 
贡献 程度 不 一 致 ,Mean Shift 引进 核 函 数 和 权重 系数 ,其 中 比较 常见 的 有 单位 均匀 核 函 数 、 高 斯 


核 函 数 ,其 表示 如 下 。 
PRALI JAA PRIR: 
1 ifla] «1 
F(x) 7 lo ar 21 Conn) 
单位 高 斯 核 函 数 ; 
Nx) =e «V (10-28) 
则 Mean Shift 扩展 为 : 


X Gy (x, a) wx) (x; - x) 
M(x) == — (10-29) 
LG, -x)w(x;) 
其 中 ,Gy(x; 2x) 2 IHI 7^ G( H^" (x, -x) ) ,G(x) 是 单位 核 函数 ,HH 是 正定 的 对 称 d x d 


JERE, wlx) 20 为 权重 系数 。 因 而 式 (10-29 ) 又 可 改写 为 : 


$3; 





jets? (x; —x) 
i). 


可 以 看 到 ,如 果 所 有 采样 点 < 满足 wz) =1 和 C(x) = | 
全 退化 为 式 (10-27) 。 

2. Mean Shift 算法 流程 

在 对 目标 进行 描述 时 , 设 目标 的 中 心 位 为 ,可 以 通过 目标 的 颜色 或 灰 度 分 布 将 目标 描 
述 为， 





M,(x) =: (10-30) 





1 flx] «1, 


0 lx) St RD 








fn -< 强 | uM con -u] (10-31) 
候选 的 位 于 y 的 物体 可 以 描述 为 ; 
p(y) =& 人 | | | coc -u] (10-32) 


本 质 上 ,目标 跟踪 可 以 简化 为 寻找 最 优 的 y, 使 得 4, 和 Pp,(y) 最 相似 。9, I p, Cy) 的 最 相 
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似 性 用 Bhattacharry 系数 p(y) 来 度量 ， 即 





pLlp(y),9] ~L ÈPO, t Lp. (y) 2 IE (10-33) 
a a a 
1 V Ci g y-*i : 
p[p(y) a1 5 2 p Co) qu ien 7, | (10-34) 








其 中 ， OD (10-35) 
yet P. (Yo) 


为 了 找到 和 目标 模型 最 相似 的 位 置 , 式 (10-34) 的 值 应 当 最 小 。 在 迭代 过 程 中 , 核 函数 中 
心 从 初始 位 置 y, ,不 断 移 到 新 的 位 置 y, : 


sé he 


Ht Aa m 
i 0 
i pe 


je 











(10-36) 











10.5.3 Mean Shift 目标 跟踪 算法 实验 
(1) 算 法 Matlab 程序 清单 


clear all; 
posit = 'C : \Users \ Administrator \ Desktop 目标 跟踪 \ample ;% 第 一 帧 用 鼠标 选择 要 跟踪 的 
物体 
rgb = imread( strcat( posit , VV V, Vl. jpg) ) ; 
figure( 1 ) ,imshow( rgb) ; 
[ temp, rect] = imcrop( rgb) ; 
[a,b,c] = size(temp) ; 
9o 目标 中 心 坐标 
y(1) =a/2; 
y(2) 2b/2; 
m. wei = zeros( a,b) ; 96 (EL XR KE 
h=y(1)2 +y(2)2 ;和 带宽 
多 计算 权 值 矩阵 
fori=l:a 
for j 21:b 
dist = (i-y(1) )2 + (j-y(2))2; 
m wei(i,j) =1-dist/h; 96 epanechnikov profile 
end 
end 
C z 1/sum( sum( m, wei) ) ;% 归 一 化 系数 
= 
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% 计 算 目 标 权 值 直 方 图 qu 
% hist] =C * wei_hist( temp,m_wei,a,b) ;% target model 
histl = zeros( 1,4096) ; 
forizl:a 
for j =1:b 
% rgb 颜色 空间 量化 为 16 * 16 * 16 bins 
q_r=fix( double( temp(1,j,1) )/16) ; 
q. g = fix( double( temp(1,j,2) )/16) ; 
q. b = fix( double( temp(i,j,3) )/16) ; 
q temp-qr*256«q g*16-4q b; 
histl (q- temp +1) = histl(q temp +1) 4 m wei(i,j) ; 
end 
end 
hist] = histl * C; 
rect(3) = ceil( rect(3) ) ; 
rect(4) = ceil( rect(4) ) ; 
myfile = dir( strcat( posit, V ,' * . jpg) ) % 读 取 序 列 图 像 
lengthfile = length ( myfile) ; 
for 1 = 1 :lengthfile 
Im = imread( strcat( posit , ' V , " , num2str(1) ,'. jpg) ) ; 
End 
num =0; 
Ys[2,2]; 
while( ( Y(1)/2 - Y(2)/2 >0.5)&num «20) — 96 96 mean shift 迭代 
num - num +1; 
templ = imcrop( Im ,rect ) ; 
hist2 = zeros( 1,4096) ;% 计 算 候 选区 域 直 方 图 
forizl:a 
for j =1:b 
q. r = fix( double( templ(i,j,1) )/16) ; 
q. g = fix( double( templ(1,j,2) )/16) ; 
q_b = fix( double( templ(i,j,3) )/16) ; 
q_templ (i,j) 2q r*256 +q_g * 16 +q_b; 
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hist2(q_templ(i,j) +1) = hist2(q_templ (i,j) +1) * m wei(i,j) ; 


end 
end 
hist2 = hist2 * C; 
w = weights( histl ,hist2 ) ; % 权 值 计算 
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sum_w =0; 
xw 2 [0,0]; 
forizl:a; 
for j zl:b 
bitwei(i,j) 2» w(uint32(q templ(i,j) ) +1); 
sum, w 2 sum w + w(uint22(q templ(i,j)) +1); 
xw 2 xw + w( uint32(q. templ(i,j) ) +1) *[i-y(1)-0.5,j-y(2) 0.5]; 
end 
end 
Y 2xw/sum w 
rect(1) 2 rect(1) € Y(2); % 中 心 点 位 置 更 新 
rect(2) =rect(2) +Y(1); 
end 
vl =rect(1); 
v2 =rect(2); 
v3 =rect(3); 
v4 =rect(4); 
figure (2) 96 显示 跟踪 结果 
clf 
imshow( uint8 ( Im ) ) 
hold on; 
plot( [v1 ,v1 & v3] ,[v2,v2] ,[ v13, v1 ], [2,2 & v4] , [vl , v] v3], [v2 * v4, v2 t v4) ,[ v1 
£y3 v1 & v3], [ v2, v2 & v4] ,LineWidth',1 , Color ,'g') 
end 
(2) 实 验 结果 分 析 
如 图 10-18 中 所 示 ,图 10-18a ) 为 视频 的 第 1 帧 图 像 , 图 10-18b ) 为 第 1 帧 圈 选 定 跟 踪 的 目 
标 区 域 ,图 10-18c) .10-18d) 分 别 为 视频 的 第 60 帧 和 第 80 帧 时 的 跟踪 结果 。 由 分 析 算 法 的 原 
理 和 结果 可 知 ,MeanShift 目标 跟踪 算法 可 以 通过 圈定 目标 区 域 ,对 初始 帧 中 目标 区 域 的 所 有 
像素 点 计算 特征 空间 中 每 个 特征 值 的 概率 , 即 目标 模型 的 描述 。 所 谓 的 特征 空间 ,就 是 将 彩色 
序列 图 像 像素 的 RGB 空间 的 每 个 子 空间 都 按 直 方 图 的 方式 分 为 个 空间 ,区 间 对 应 的 值 称 为 
特征 值 ,所 有 的 这 些 区 间 组 成 了 特征 空间 , 共 包 含 了 个 特征 值 。 在 以 后 的 每 帧 中 可 能 存在 
目标 候选 区 域 ,对 其 特征 空间 的 每 个 特征 值 的 计算 称 为 候选 模型 的 描述 。 利 用 相似 函数 度量 
初始 帧 目标 模型 的 相似 性 ,通过 求 相 似 函 数 最 大 值得 到 关于 目标 的 MeanShift 向 量 , 由 Mean- 
Shift 算法 的 收敛 性 ,不断 和 迭代 计算 MeanShift 向 量 。 在 当前 帧 中 ,最 终 目 标 会 收敛 到 目标 的 真 
实 位 置 ,从 而 达到 跟踪 的 目的 。 
MeanShift 算法 可 以 自行 设 定 要 跟踪 的 目标 区 域 ,这 是 算法 的 一 大 优点 ,但 缺乏 必要 的 模 
板 更 新 , 当 目 标尺 度 有 所 变化 时 ,跟踪 就 可 能 出 现 问 题 ,而 且 目 前 的 MeanShift 跟踪 算法 只 能 跟 
踪 一 个 目标 ,计算 量 较 大 。 
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o) 第 60 帧 d) 280b f 


图 10-18 MeanShift 目标 跟踪 算法 


10.6 三 维 重 构 


三 维 重 构 是 指 对 三 维 物体 建立 适合 计算 机 表示 和 处 理 的 数学 模型 。 通 过 对 图 像 进行 
预 处 理 , 产生 了 一 幅 计算 机 易于 识别 和 理解 的 图 像 ,实现 图 像 的 三 维 重 构 。 三 维 重 构 算 法 
领域 涉及 图 像 处 理 .计算 机 图 形 学 虚拟 现实 以 及 模式 识别 等 诸多 领域 。 空 间 的 三 维 重 构 
问题 根据 不 同 的 实际 情况 算法 的 种 类 非常 多 ,但 核心 的 思想 还 是 利用 三 角形 来 覆盖 待 重 构 
区 域 的 表面 。 

三 维 重 构 的 步骤 如 下 。 

(1) 图 像 获取 :在 进行 图 像 处理 之 前 , 先 要 用 摄像 机 获取 三 维 物体 的 二 维 图 像 。 光 照 条 
件 、 相 机 的 几何 特性 等 对 后 续 的 图 像 处 理 造成 很 大 的 影响 。 

(2) 摄像 机 标定 :通过 摄像 机 标定 来 建立 有 效 的 成 像 模 型 ,求解 出 摄像 机 的 内 外 参数 ,这 
样 就 可 以 结合 图 像 的 匹配 结果 得 到 空间 中 的 三 维 点 坐标 ,从 而 达到 三 维 重建 的 目的 。 

(3) 特 征 提取 :特征 主要 包括 特征 点 特征 线 和 区 域 。 大 多 数 情况 下 都 是 以 特征 点 为 匹配 
基 元 ,特征 点 以 何 种 形式 提取 与 用 何 种 匹配 策略 紧密 联系 ,因此 在 进行 特征 点 的 提取 时 需要 先 
确定 用 哪 种 匹配 方法 。 

特征 点 提取 算法 可 以 总 结 为 :基于 方向 导数 的 方法 ,基于 图 像 亮度 对 比 关系 的 方法 ,基于 
数学 形态 学 的 方法 三 种 。 

(4) 立 体 匹配 ;立体 匹配 是 指 根据 所 提取 的 特征 来 建立 两 幅 图 像 匹 配 基 元 对 之 间 的 一 种 
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对 应 关系 ,也 就 是 将 同一 物理 空间 点 在 两 幅 不 同 图 像 中 的 成 像 点 一 一 对 应 。 与 普通 的 图 像 配 
EAS a] ,立体 像 对 之 间 的 差异 是 由 摄像 时 观察 点 的 不 同 引 起 的 ,而 不 是 由 其 他 如 景物 本 身 的 变 
化 或 运动 所 引起 的 。 在 进行 匹配 时 要 注意 场景 中 一 些 因素 的 干扰 ,比如 光照 条 件 、 噪 声 干 扰 、 
景物 几何 形状 畸变 、 表 面 物理 特性 以 及 摄像 机 机 特性 等 诸多 变化 因素 。 根 据 匹 配 基 元 的 不 同 ， 
立体 匹配 可 分 为 区 域 匹配 、 特 征 匹 配 和 相位 匹配 三 大 类 。 

区 域 匹配 

区 域 匹 配 算法 以 基准 图 的 待 匹配 点 为 中 心 创建 一 个 窗口 ,用 邻 域 像素 的 灰 度 值 分 布 来 表 
征 该 像素 ,然后 在 对 准 图 中 寻找 这 人 么 一 个 像素 ,以 其 为 中 心 创建 同样 的 一 个 窗口 ,并 用 其 邻 域 
像素 的 灰 度 值 分 布 来 表征 它 ,两 者 间 的 相似 性 必须 满足 一 定 的 浆 值 条 件 。 基 于 区 域 的 匹配 算 
法 的 优点 是 可 以 得 到 致密 的 视差 图 ,缺点 是 匹配 窗口 大 小 难以 选择 。 

@) 特 征 匹 配 

特征 匹配 算法 是 为 使 匹配 过 程 满足 一 定 抗 品 能 力 且 减 少 歧义 性 问题 而 提出 的 。 一 般 地 ， 
用 于 匹配 的 特征 应 满足 以 下 特性 :唯一 性 .再 现 性 ,具有 物理 意义 。 作 为 匹配 基 元 的 特征 分 为 
局 部 特征 和 全 局 特征 两 大 类 。 局 部 特征 包括 点 边缘、 线段 ,小 面 或 局 部 能 量 。 全 局 特征 包括 
多 边 形 和 图 像 结 构 等 。 特 征 匹配 不 直接 依赖 于 灰 度 ,具有 和 较 强 的 抗 干 扰 性 ,而 且 计 算 量 小 , 速 
度 较 快 。 特 征 匹 配 算法 也 存在 着 一 些 不 足 : 特 征 在 图 像 中 的 稀 朴 性 决定 特征 匹配 只 能 得 到 稀 
玻 的 视差 场 ; 特 征 的 提取 和 定位 过 程 直 接 影响 匹配 结果 的 精确 度 。 

@ 相 位 匹配 

相位 匹配 是 近 二 十 年 才 发 展 起 来 的 一 类 匹配 算法 。 相 位 作为 匹配 基 元 ,本 身 反映 信和 号 的 
结构 信息 ,对 图 像 的 高 频 噪 声 有 很 好 的 抑制 作用 , 适 于 并 行 处 理 ,能 获得 亚 像素 级 精度 的 致密 
视差 ,但 存在 相位 奇 点 和 相位 卷 绕 的 问题 , 需 加 入 自 适 应 滤波 器 解决 。 

(5) 三维 重 构 : 有 了 比较 精确 的 匹配 结果 ,我 们 得 到 了 空间 的 离散 点 ,点 与 点 之 间 的 情形 
是 未 知 的 ,更 不 能 构成 平面 或 曲面 ,为 了 使 物体 真实 地 显示 出 来 ,需要 对 这 些 点 进行 剖 分 ,结合 
摄像 机 标定 的 内 外 参数 ,并 赋予 其 深度 信息 ,从 而 得 到 场景 的 三 维 重 构 模 型 。 由 于 三 维 重 构 精 
度 受 匹配 精度 ,摄像 机 的 内 外 参数 误差 等 因素 的 影响 ,因此 首先 需要 做 好 前 面 几 个 步骤 的 工 
作 , 使 得 各 个 环节 的 精度 高 ,误差 小 ,这 样 才 能 设计 出 一 个 比较 精确 的 立体 视觉 系统 。 

三 维 实体 模型 的 表示 方法 主要 有 体 单元 法 、 八 又 树 ,多 面体 、 高 度 图 、 样 条 多边形、 分 形 几 
何 及 小 波 、Alpha 形体 、 线 框 模 型 三 角形 网 格 和 符号 表示 等 。 在 我 们 的 双 目 立体 视觉 重 构 研 
究 中 ,三 维 数据 是 利用 立体 视觉 匹配 获得 的 离散 数据 ,通常 可 以 用 深度 图 ( depth map ) 来 表示 ， 
由 于 存在 着 遮挡 现象 ,有 时 采集 的 数据 并 未 提供 景物 的 全 部 信息 ,这 种 数据 的 一 个 明显 特征 是 
该 数据 集 可 以 投影 到 和 深度 测量 轴 垂 直 的 平面 区 域 上 ,为 了 与 真正 的 三 维 数据 区 分 ,这 种 数据 
称 为 2.5D 数据 ,通常 几 个 2.5D 数据 可 以 合成 一 个 3D 数据 集 。 

现 有 的 三 维 信息 获取 手段 有 很 多 ,例如 可 以 利用 现成 的 建 模 软件 ,如 3DMax、Maya 等 构造 
三 维 模型 ,此 类 软件 由 于 可 以 构建 人 造物 体 以 及 添加 泻 染 效果 因此 被 广泛 运用 于 影视 作品 中 。 
这 些 软件 的 操作 十 分 复杂 , 建 模 所 需要 的 周期 长 ,需要 大 量 熟练 这 类 软件 的 操作 人 员 ,使 得 制 
作成 本 很 高 ,制作 周期 很 长 。 使 用 一 些 专用 仪器 设备 ,例如 三 维 扫描 仪 或 激光 测 距 仪 可 以 获取 
现实 物体 的 三 维 模型 ,并 且 通 过 这 类 设备 重 构 出 的 物体 具有 相当 高 的 精度 。 这 类 设备 使 用 比 
较 方便 , 建 模 时 间 也 比较 短 , 但 是 ,这 类 设备 的 研发 经 费 很 高 ,设备 昂贵 ,对 于 一 些 无 法 搬运 的 
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物体 或 者 室外 较 大 的 物体 无 法 适用 。 在 现实 中 的 众多 应 用 中 ,对 重建 结果 的 精确 度 并 无 较 高 
要 求 。 三 维 重 构 技 术 的 大 多 数 研 究 成 果 仍 然 处 于 实验 室 阶段 ,而 且 整 体 上 进展 甚 微 ,拓展 研究 
思路 是 十 分 有 必要 的 。 

现 有 的 双 目 视觉 系统 下 ,已 经 可 以 搭建 简单 的 包括 立体 图 对 的 采集 标定、 预 处理 .立体 匹 
配 及 视差 图 的 后 处 理 、 三 维 重 构 及 可 视 化 等 全 部 环节 在 内 的 机 器 视觉 系统 ,实现 双 目 立 体 视觉 
进行 三 维 重 构 基 本 验证 ,为 完成 移动 机 器 人 的 视觉 导航 任务 商定 了 基础 。 


10.7 本 章 小 结 
本 章 以 图 像 去 雾 . 图 像 融 合 、 运 动 目 标识 别 .目标 跟踪 为 例 , 介 绍 了 图 像 处 理 与 机 器 视觉 技 


术 在 实际 中 的 具体 应 用 ,并 简单 介绍 了 三 维 重 构 方 法 。 通 过 本 章 的 学 习 , 可 以 加 深 对 之 前 章节 
知识 的 认识 ,对 当前 比较 热门 的 机 器 视觉 算法 的 流程 有 大 致 的 了 解 。 





1. 常见 的 基于 增强 的 数字 图 像 去 雾 算 法 有 哪些 ? 与 基于 物理 模型 的 图 像 去 雾 算 法 在 本 质 
上 有 什么 区 别 ? 

2. 编写 基于 直方 图 均衡 化 的 图 像 去 雾 算法 的 Matlab 程序 实现 ,并 分 析 该 算法 去 雾 效 果 的 
优 缺点 。 

3. 参考 基于 小 波 变换 的 图 像 融 合算 法 的 基本 流程 , 试 编写 基于 DCT 变换 的 图 像 融 合算 法 
的 Matlab 实现 。 

4. 编写 基于 背景 减 除法 的 运动 目标 检测 算法 的 Matlab 程序 实现 。 

5. 编写 基于 帧 间 差 分 法 的 目标 跟踪 算法 的 Matlab 程序 实现 。 
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